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APRESENTAÇÃO 


Devido à importância da execução de levantamentos tridimensionais de 
superfícies e sua representação cartograficamente, existem diversas metodologias 
para a realização desse tipo de trabalho. Por isso o valor dos instrumentos ou 
sensores a serem utilizados, a qualidade e quantidade requeridas dos dados, bem 
como sua precisão, O rigor necessário durante as atividades de campo e o tempo 
despendido para realizá-las são os principais fatores que influenciam na escolha do 
tipo de técnica de ser aplicada conforme a finalidade do levantamento. Nesse sentido, 
o método de fotogrametria que faz uso do processamento das imagens por algoritmos 
de Structure from Motion e Multi-View Stereo (SfM-MVS) surgiu como uma alternativa 
consideravelmente mais acessível financeiramente que a fotogrametria tradicional e 
que os equipamentos de varredura, uma vez que os sensores utilizados podem ser 
de câmeras digitais não métricas, permitindo também a versatilidade do uso de 
plataformas como pipas, balões, veículos aéreos não tripulados (VANTS), bastões 
telescópicos e até mesmo sem acoplar a câmera em nenhum instrumento. Além disso, 
por não requerer pontos de controle para solucionar a geometria da superfície, apenas 
para referenciá-la, o operacional relacionado ao apoio de campo torna-se mais barato 
e de fácil execução. Portanto, por se tratar de uma metodologia inovadora e com 
bastante potencial para melhorar cada vez mais a precisão e acurácia dos dados 
coletados, o uso de SfM-MVS vem sendo amplamente estudado pela comunidade 
científica internacional. 

No entanto, é uma temática que ganhou representatividade para aplicações 
direcionadas as geociências somente na última década. Assim, o referente estudo foi 
realizado como uma forma de analisar a viabilidade do emprego da técnica SfM-MVS 
para geração de modelos digitais do terreno e produtos cartográficos planialtimétricos 
com qualidade posicional a partir de imagens obtidas com fotogrametria terrestre. 
Para isso, tais modelos foram classificados conforme os parâmetros de exatidão 
brasileiros estabelecidos pela Comissão Nacional de Cartografia (2011), adaptados 
para escalas grandes considerando fotos capturadas à curta distância. Para isso, 
realizou-se uma ampla pesquisa bibliográfica que pudesse nortear a escolha da 
metodologia a ser aplicada, considerando que a coleta de dados em campo pode ser 
executada de diversas maneiras, bem como esses algoritmos permitem diferentes 
implementações e etapas a serem realizados em softwares ou plataformas. Devido à 
variabilidade de combinações existentes, tais possibilidades foram discutidas 
brevemente no escopo deste trabalho, recomendando as referências citadas aos 
leitores que desejam se aprofundar nessa temática. 

A divisão desta publicação segue, então, com 7 capítulos: o primeiro com uma 
visão geral sobre o tema associado ao avanço tecnológico; os três seguintes retratam 
o embasamento teórico que fundamentam este estudo (relativo à fotogrametria, SfM- 
MVS e controle de qualidade cartográfico); o quinto com a explicação minuciosa dos 
materiais utilizados e métodos aplicados; o sexto com os resultados numéricos obtidos 
e discussões a respeito do que representam, além da exposição de mapas gerados 
com os dados coletados; o último com o apontamento das conclusões gerais do 
trabalho, bem como as contribuições da pesquisa e suas limitações. 
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CAPÍTULO 01 


INTRODUÇÃO 





Com o desenvolvimento da tecnologia, os avanços em precisão, automatização 
e rapidez na coleta de dados espaciais abrangeram diversos ramos das geociências, 
sendo perceptíveis as mudanças no aperfeiçoamento de instrumentos como os 
medidores eletrônicos de distância, com o surgimento de estações totais robóticas e 
equipamentos de varredura como o laser scanner que possibilitam o armazenamento 
de centenas de milhares de pontos por segundo, os receptores de Sistema Global de 
Navegação por Satélite (GNSS), que integraram a coleta de dados emitidos por 
diversas constelações (GPS, Glonass, Galileo, Beidou e Compass). 

No quesito de imageamento das superfícies, os Veículos Aéreos Não 
Tripulados (VANTs) passaram a ter mais autonomia de voo permitindo fotografar 
áreas maiores com resultados métricos mais acurados e os satélites de 
sensoriamento remoto obtiveram significativa melhora em suas resoluções espaciais, 
temporais, radiométricas e espectral, entre outros. Além disso, o processamento de 
informações geográficas também se tornou mais dinâmico e acessível aos 
profissionais que trabalham com esses dados, tendo sido criados algoritmos com 
análises mais detalhadas e que exigem menos do hardware dos computadores. 

Entretanto, para a formação de modelos digitais de elevação do terreno (MDT), 
utilizando técnicas de topografia clássica ou levantamentos geodésicos a coleta de 
dados tridimensionais é realizada ponto a ponto, limitando assim o nível de 
detalhamento das feições retratadas. Assim, é necessário que sejam escolhidos 
previamente, de acordo com os relevos mais notáveis, quais feições terão seus dados 
espaciais armazenados. Já em relação aos produtos cartográficos resultantes do 
processamento de imagens por fotogrametria, o volume de informações geoespaciais 
disponíveis é considerável, uma vez que a restituição realizada permitirá o 
referenciamento simultâneo de vários pontos com precisão, contudo com a 
desvantagem de que o processo exige grande conhecimento específico do 
profissional e o alto rigor na execução do levantamento (STUMPF et al., 2014). 

Quanto aos instrumentos de varredura como o laser scanner, esse instrumento 
é capaz de gerar uma nuvem densa de pontos, permitindo que o MDT gerado possua 
grande nível de detalhamento, além de realizar a coleta de dados de forma 


automatizada. Contudo, a utilização dessa técnica ainda é muito restrita devido ao 
preço do equipamento que é bastante oneroso. No tocante ao processamento de 
imagens de sensores altimétricos presentes nos satélites (SRTM, ASTER, etc), 
apesar da facilidade de obtenção das informações, o fato das resoluções espaciais 
dessas bandas espectrais serem normalmente na grandeza de metros costuma limitar 
seu uso a áreas muito grandes e modelos de elevação com precisões 
significativamente inferiores aos levantamentos topográficos e geodésicos (SMITH; 
CARRIVICK; QUINCEY, 2016). 

Por meio de avanços de visão computacional e da fotogrametria digital, surgiu 
a técnica Structure from Motion (SfM), cujo princípio foi inicialmente proposto por 
Ullman (1979) com o intuito de realizar a interpretação tridimensional de superfícies a 
partir de transformações bidimensionais de suas projeções em perspectiva, isto é, de 
fotografias desses objetos, sem que fossem necessários ter conhecimento inicial de 
nenhuma informação tridimensional. Desse modo, sem ter a determinação inicial nem 
dos parâmetros internos da câmera nem de pontos de controle, a reconstrução 
geométrica a partir das imagens é executada por meio de reconhecimento e 
correspondência de feições seguida da solução simultânea da estrutura e do 
movimento do objeto, gerando uma nuvem de pontos esparsa em um sistema de 
coordenadas arbitrário. Torna-se, então, opcional submetê-la à escala e referenciá-la 
a um Datum existente. 

Posteriormente, com o intuito de gerar modelos digitais do terreno mais 
consistentes, representativos e com maior qualidade, foram desenvolvidas 
metodologias para densificar essa nuvem de pontos, dando origem aos algoritmos de 
Multi-View Stereo (MVS). Esse método consiste em utilizar a posição dos pontos de 
exposição e os parâmetros de orientação interna e externa da câmera solucionados 
no SfM como informação a priori para que seja resolvida a configuração espacial dos 
objetos existentes nas imagens utilizadas, propiciando o acréscimo da quantidade de 
pontos em, no mínimo, dois graus de magnitude, bem como permitindo a redução dos 
ruídos e erros na correspondência de feições (HARWIN; LUCIEER, 2012; QU; 
HUANG; ZHANG, 2018). 


CAPÍTULO 02 


FOTOGRAMETRIA 





O termo fotogrametria é etimologicamente derivado de três palavras em grego: 
photos que significa luz, gramma, que se refere à descrição gráfica e metron, que 
significa medir. Desse modo, analisando a origem da palavra, fotogrametria consiste 
em realizar medições graficamente através da análise da luz (MARCHETTI; GARCIA, 
1986). Por esse motivo, a Sociedade Americana de Fotogrametria (1998) apud 
Tomaselli et. al (1999, p.1) definiu-a como sendo: 


A arte, ciência e tecnologia de obtenção de informação confiável sobre 
objetos físicos e o meio ambiente através de processos de registro, medição 
e interpretação de imagens fotográficas e padrões de energia 
eletromagnética irradiada e outras fontes. 


Como é possível deduzir a partir de sua nomenclatura, essa ciência 
inicialmente baseava-se apenas na análise de fotografias, mas com o advento da 
tecnologia, o uso de sensores como imageamento digital, laser scanners, fenômenos 
eletromagnéticos e energia acústica irradiada ganhou destaque por abranger a 
aplicação em situações adversas e facilitar a aquisição de dados espaciais para 
diversas finalidades. Além disso, seu conceito também está ligado a duas subáreas 
distintas e de extrema importância para o processo de restituição das informações 
presentes no local levantado, as quais consistem na etapa métrica e interpretativa da 
fotogrametria, se referindo respectivamente à análise quantitativa e qualitativa das 
imagens obtidas (WOLF; DEWITT; WILKINSON, 2014). 

A investigação quantitativa na fotogrametria tem o objetivo de permitir a 
localização relativa de pontos e a obtenção de distâncias, áreas, volumes, elevações, 
ângulos e forma dos objetos por meio da execução de medições precisas nas 
fotografias, sendo geralmente destinada para a confecção de mapas topográficos e 
planimétricos, bem como de ortofotos. Já na etapa conhecida como fotointerpretação 
são realizadas análises para detectar objetos e atribuir-lhes significados, através de 
uma avaliação cuidadosa e sistemática, determinando os tipos de vegetação 
presente, classificando os solos, identificando formações geológicas, reconhecendo 
diferentes cultivos, constatando poluição de corpos hídricos, entre outras formas de 
análise que estão ligadas às características qualitativas da região estudada. Assim, é 


importante enfatizar que, no processo de interpretação, mesmo não sendo essencial, 


geralmente é necessário que sejam realizadas algumas medições, da mesma forma 
que uma certa quantidade de interpretação deve ser aplicada durante a etapa métrica 
e por isso ambas estão profundamente interligadas ao conceito de fotogrametria 
(MOFFIT; MIKHAIL, 1980; WOLF; DEWITT; WILKINSON, 2014). 

2.1 CONCEITOS FUNDAMENTAIS 

Como forma de facilitar o entendimento dos princípios intrínsecos à 
fotogrametria e a metodologia envolvida nos processos de restituição de dados 
geográficos de objetos e superfícies a partir de imagens, é importante que sejam 
discutidos conceitos que fundamentam a aplicação dessa ciência e dão suporte para 
realizar o planejamento e a execução tanto do trabalho de campo quanto de escritório, 
pertinentes em levantamentos fotogramétricos. Além disso, também se faz necessário 
esclarecer termos que envolvem outras áreas, fenômenos ou mesmo produtos 
gerados a partir do uso da fotogrametria como ferramenta de mapeamento com 
precisão métrica. 

2.1.1 ESTEREOSCOPIA 

Quando são visualizados objetos que se encontram a diferentes distâncias do 
ponto em relação ao observador, simultaneamente pelos dois olhos, ocorre o 
fenômeno natural de estereoscopia, o qual confere uma percepção da terceira 
dimensão espacial, isto é, de profundidade relativa das feições. Isso se dá pelo fato 
de que os olhos humanos são separados por uma distância de aproximadamente 
65mm, permitindo que um mesmo objeto seja observado de pontos de perspectivas 
diferentes no mesmo eixo, existindo uma porção da superfície identificada por ambos 
que forma uma imagem interpretada pelo cérebro como sendo tridimensional 
(PAREDES, 1986). 

Desse modo, a fotogrametria faz uso da estereoscopia com o intuito de permitir 
a reprodução desse mesmo fenômeno simulando o processo realizado pelo olho com 
o uso de fotografias. A visão estereoscópica indireta é, então, reproduzida por meio 
da visualização conjunta de um par de imagens que são capturadas em posições 
homólogas aos olhos e que são dispostas de forma que a fotografia da direita seja 
observada apenas pelo olho direito e a da esquerda pelo olho esquerdo (Figura 01). 
Por isso, essas projeções registradas consecutivamente e que apresentam uma 
região imageada em comum (superposta) são então denominadas de par 
estereoscópico (ANDRADE, 1998; PAREDES, 1986). 


Figura 01 — Visão estereoscópica. 





Fonte: Wolf, Dewitt e Wilkinson (2014). 


Assim, existem diferentes métodos de projetar a visão estereoscópica indireta, 
bem como equipamentos que auxiliam nesse processo, destacando-se: estereoscópio 
de lentes, os quais são formados por duas lentes convergentes que permitem um 
paralelismo entre os eixos óticos dos olhos e direcionam a retina para suas respectivas 
imagens; estereoscópio de espelho, que consiste na utilização de espelhos para 
propiciar um maior afastamento das fotografias por conta de suas dimensões; 
anaglifo, o qual está relacionado à impressão ou projeção das imagens com duas 
colorações distintas e que são filtradas por um óculos que permite a visualização em 
preto e branco da perspectiva; a polarização da luz nas cenas em planos 
perpendiculares em conjunto com utilização de óculos com filtros polaroides que 
direcionam as fotografias para os olhos correspondentes; e o cintilamento que 
consiste na exibição das imagens de forma alternada para os dois olhos, entretanto 
em um intervalo de tempo inferior à 1/24 segundos, que é o necessário para a imagem 
esvanecer na retina, causando o efeito de estar visualizando as duas fotos 
simultaneamente (ANDRADE, 1998). 

2.1.2 GEOMETRIA DA FOTO 

Um mapa consiste em uma porção da superfície terrestre projetada 
ortogonalmente em um plano, sendo então cada ponto do terreno representado por 
raios verticais e perpendiculares ao plano de referência. Já no caso de projeções em 


perspectiva, ou projeções centrais, como nas fotografias, todos as feições são 
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apresentadas através de um único ponto denominado de centro de perspectiva, sendo 
este o centro da lente da câmera. Desse modo, a região existente entre o centro de 
perspectiva e a foto capturada é denominado de espaço da imagem, enquanto a 
porção ocupada pelo terreno a ser fotografado, inclusive o sistema de coordenadas 
de referência, é chamado de espaço do objeto. A Figura 02 mostra essas relações 
geométricas na fotografia vertical (MOFFITT; MIKHAIL, 1980; TAVARES; 
FAGUNDES, 1991). 


Figura 02 — Geometria da foto vertical. 


Plano do negativo 
bp Ca 





Centro perspectivo 
(Ponto nodal) 


Fonte: Paredes (1986). 


O plano da imagem contém uma projeção bidimensional de um espaço do 
objeto tridimensional, sendo possível representar cada ponto na fotografia através de 
um sistema de coordenadas cartesianas com origem no centro da foto, definindo os 
eixos planimétricos através das marcas fiduciais (sistema fiducial). No entanto, para 
descrever a elevação do terreno, o terceiro eixo é estabelecido como saindo da 
imagem, no caso de imagens aéreas é definido como o eixo Z e para fotografias 
terrestres como o eixo X. Para o espaço objeto é normalmente utilizado um sistema 
dextrógeno e tridimensional, também de coordenadas cartesianas. Mesmo que seja 
possível definir outros tipos de coordenadas para determinar a posição espacial dos 
pontos de controle, o desenvolvimento matemático que relaciona o espaço do objeto 
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e da imagem é mais simplificado se ambos forem transformados anteriormente em 
sistemas cartesianos (MOFFITT; MIKHAIL, 1980). 

Visando apresentar definições importantes referentes à geometria da foto, 
podem ser descritos os conceitos de (MARCHETTI; GARCIA, 1986; PAREDES, 
1986): Distância focal: é a distância perpendicular entre o ponto nodal (centro de 
perspectiva) e o plano de projeção da fotografia; Estação ou ponto de exposição: é a 
posição no espaço do ponto nodal na tomada da fotografia; Altura de voo: é a distância 
vertical entre o ponto de exposição e a superfície terrestre fotografada; Ponto-nadir: é 
o ponto no qual a linha vertical intercepta o plano da fotografia ou o terreno, através 
do centro de perspectiva da câmera. 

Quanto à escala das imagens, diferente de mapas na qual existe uma 
proporção direta entre todas as linhas representadas no mapa e suas 
correspondências na superfície terrestre, não é possível estabelecer uma única escala 
para a fotografia vertical. Isso acontece porque, sendo a escala da foto a relação entre 
a distância focal e a distância do ponto de exposição ao objeto, essa altura de voo 
varia por conta do relevo do terreno, apresentando diferentes relações de 
proporcionalidade ao longo de uma mesma imagem. Por esse motivo, para 
representar a escala nas fotos verticais, é determinada uma distância média, levando 
em consideração um plano médio sobre a área fotografada, resultando em uma escala 
aproximada das linhas projetadas (MARCHETTI; GARCIA, 1986; TAVARES; 
FAGUNDES, 1991). 

2.2 APOIO TERRESTRE 

De acordo com Wolf, Dewitt e Wilkinson (2014), normalmente o controle 
fotogramétrico é composto de pontos cujas posições são conhecidas em um sistema 
de coordenadas no espaço e cujas imagens podem ser claramente visualizadas e 
identificadas nas fotografias. Assim, o apoio terrestre proporciona a relação entre as 
fotografias e o terreno, sendo necessário em praticamente todas as etapas do trabalho 
fotogramétrico. Esse controle é geralmente dividido em planimétrico, que a posição 
do ponto é relacionada a um datum horizontal, e altimétrico, na qual a posição refere- 
se a um datum vertical. Tal separação ocorre devido à diferença entre os sistemas de 
referência e entre os métodos utilizados para a definição dos pontos de controle 
horizontal e vertical. Entretanto, é comum deparar-se com pontos cujas coordenadas 


tridimensionais são conhecidas, funcionando como controles em ambos os aspectos. 


O processo de levantamento para controle fotogramétrico é tradicionalmente 
baseado em dois passos, embora como advento do uso do GNSS essas etapas não 
estejam bem distinguidas uma da outra. A primeira fase consiste na determinação de 
uma rede de controle básico na área em que será realizado o imageamento, formada 
por marcos de controle horizontal e vertical, que serão utilizados como estruturas de 
referência para o estabelecimento dos pontos de controle na fotografia. Já o segundo 
passo envolve o estabelecimento da localização do controle na fotografia a partir 
desse processo, feito com base nas imagens dos pontos nas fotos. Assim, a definição 
de um bom controle terrestre é um fator imprescindível em praticamente todo projeto 
fotogramétrico, sendo importante ressaltar que a acurácia dos produtos finais não 
pode ser superior à dos pontos de controle utilizados. Portanto, devido à importância 
dessa etapa sua execução deve ser bem planejada, principalmente porque seu custo 
é normalmente considerável, podendo chegar de 10 a 50 % do custo total do projeto 
em alguns casos (WOLF; DEWITT; WILKINSON, 2014; LEHMANN, 1975). 

2.2.1 CONTROLE HORIZONTAL 

Existem vários métodos para a execução de levantamentos de campo, dentre 
os quais podemos destacar os principais como sendo poligonação, triangulação e 
trilateração. No referente aos instrumentos, as estações totais e os teodolitos são 
amplamente utilizados para medição de ângulos e distâncias associadas à essas 
metodologias (MOFFITT; MIKHAIL, 1980). 

O processo de poligonação é o mais empregado em práticas de campo e 
consiste na medição de ângulos e distâncias horizontais entre pontos consecutivos de 
uma rede fechada (no caso de poligonais fechadas), incluindo as estações de controle 
já existentes na região. Apoiadas nas coordenadas dessas estações e nos ângulos e 
distâncias medidas, as coordenadas dos demais pontos são calculadas 
trigonometricamente no sistema de coordenadas retangular dos referenciais de 
controle. Geralmente é realizado um ajustamento desses parâmetros, devido à 
abundância de observações providas em campo, com o intuito de reduzir os erros 
nessas coordenadas (WOLF; DEWITT; WILKINSON, 2014). 

Já para a triangulação e a trilateração a rede deve ser composta por figuras 
triangulares, sendo no primeiro caso realizadas medições dos ângulos horizontais 
entre as estações e no segundo das distâncias entre os pontos. Usualmente esses 
métodos são utilizados simultaneamente, de forma que a quantidade de observações 


se torna bem maior que as variáveis a se determinar (coordenadas das estações). 
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Isso significa que através do ajustamento por mínimos quadrados a acurácia dessas 
coordenadas torna-se bem melhor (MOFFITT; MIKHAIL, 1980). 

2.2.2 CONTROLE VERTICAL 

No referente aos pontos de controle verticais, estes são comumente 
estabelecidos a partir da determinação da diferença altimétrica com o uso de níveis e 
hastes graduadas. O instrumento denominado de nível nada mais é que um telescópio 
de observação com retículo para leitura na mira graduada que se mantem inclinado a 
90 graus em relação a seu eixo vertical, garantindo que as medições entre dois pontos 
sejam realizadas no mesmo plano (horizontal). Assim, basta subtrair a medição 
encontrada no ponto que se deseja determinar a cota por aquele de coordenada 
vertical conhecia (WOLF; DEWITT; WILKINSON, 2014). 

Outro método para determinação de diferença de níveis é através do 
nivelamento trigonométrico, cuja utilização é indicada em situações que a acurácia 
exigida é relativamente moderada e quando o terreno for muito acidentado. Para esse 
processo são normalmente usadas estações totais, a partir das quais são medidos o 
ângulo zenital e a distância inclinada entre o ponto de controle e o refletor, posicionado 
sobre o ponto a que se destina. Desse modo, sua cota é calculada com o uso de 
relações trigonométricas, justificando a nomenclatura desse tipo de nivelamento. É 
importante ressaltar que a compensação dos erros devido à curvatura da Terra e à 
refração atmosférica devem ser corrigidos em qualquer que seja a metodologia 
adotada, podendo ser por modelos matemáticos ou, no caso do nivelamento com 
nível, posicionando o aparelho à igual distância entre os dois pontos, procedimento 
conhecido como método das visadas iguais (MOFFITT; MIKHAIL, 1980). 

2.2.3 CONTROLE TERRESTRE COM GNSS 

O desenvolvimento do chamado GNSS (Global Navigation Satellite System), 
tem revolucionado todas as atividades que necessitam de posicionamento. No intuído 
de usufruir destas novas tecnologias e, principalmente, do potencial dos sistemas de 
posicionamento globais existentes, com o passar dos anos, os métodos para tal 
aplicação vêm se aprimorando. Nesse contexto, Monico (2008) classifica esse tipo de 
posicionamento de acordo com duas características principais: em razão do 
referencial ao quão estão sendo relacionadas as coordenadas, podendo ser absoluto, 
relativo ou diferencial, e em relação ao estado inercial do objeto, sendo subdividido 


em estático, cinemático e estático rápido. 


Dentre eles, o mais usado na fotogrametria são os posicionamentos estáticos 
relativo e diferencial, devido à maior precisão posicional obtida por esses métodos 
(WOLF; DEWITT; WILKINSON, 2014). O posicionamento relativo consiste na 
utilização de no mínimo dois receptores medindo simultaneamente os sinais 
transmitidos pelos satélites, cuja observável é a diferença de fase da onda portadora. 
Já no posicionamento diferencial (DGPS), temos a exigência do uso de uma estação 
geodésica já existente, em âmbito nacional as que fazem parte da Rede Brasileira de 
Monitoramento Contínuo dos Sistemas GNSS (RBMC), cujas coordenadas 
conhecidas devem estar referenciadas a um sistema geodésico (MONICO, 2008). 

2.3 FOTOTRIANGULAÇÃO 

O processo de determinação das coordenadas cartesianas terrestres X, Ye Z 
de pontos suplementares de controle horizontal e vertical por meio das relações 
geométricas entre as fotografias é usualmente denominado de aerotriangulação. 
Entretanto, o termo fototriangulação é mais abrangente, uma vez que esse método 
também pode ser aplicado para fotos terrestre. Dentre os variados empregos dessa 
técnica, podemos citar como um dos principais a densificação de pontos de controle 
terrestres a partir de faixas e blocos de fotografias para uso em posteriores projetos 
fotogramétricos. Como o número mínimo de pontos de controle necessários em cada 
modelo estereoscópio é de dois planimétricos e três altimétricos, sendo em casos de 
mapeamento de grandes áreas necessários várias estações de controle, o custo para 
definição destes pode ser oneroso se for feita unicamente por meio de medições 
topográficas. Portanto, muitos desses pontos de controle são determinados através 
da fototriangulação, baseados em uma pequena rede de levantamento de campo 
(ANDRADE, 1998; PAREDES, 1986). 

Além do valor econômico ser consideravelmente menor, há outras vantagens 
no uso da fototriangulação em relação às medições topográficas, entre elas: a maior 
parte do trabalho é desenvolvida em escritório, portanto as condições temporais 
adversas não influenciam o andamento do projeto; a necessidade de realizar 
levantamentos de campo pode ser minimizada em locais perigosos; a acurácia do 
controle terrestre necessário é verificada durante esse processo, isso significa que a 
probabilidade de serem encontrados erros nas estações de controle após o processo 
de compilação ser iniciado é minimizado ou até mesmo eliminado. Desse modo, essas 
vantagens são tão significativas que algumas empresas executam a fototriangulação 


mesmo em regiões que possuam uma rede adequada de controle terrestre, além de 
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serem o motivo pelo qual alguns projetos de mapeamento exigem que esse processo 
seja utilizado para a determinação do controle nas fotografias (TAVARES; 
FAGUNDES, 1991; WOLF; DEWITT; WILKINSON, 2014). 

A fototriangulação pode ser realizada por duas técnicas distintas, por meio da 
triangulação radial ou da estereotriangulação. A primeira metodologia pode ser usada 
para circunstâncias em que não é exigida uma precisão rigorosa no serviço executado 
ou quando a finalidade é confeccionar produtos cartográficos como mapas 
planimétricos com pouco nível de detalhamento (escala pequena) e mosaicos 
controlados. Assim, a triangulação radial parte do princípio que as imagens são 
perfeitamente verticais (com tolerância de até 3º de inclinação), tomando como base 
as características geométricas das fotos para determinar os deslocamentos oriundos 
do relevo, das distorções das lentes e da refração atmosférica nas linhas que 
convergem para o ponto central. Portanto, os ângulos definidos no ponto principal 
da imagem não dependem da escala da fotografia nem do relevo, formando 
ângulos verdadeiros e constantes (PAREDES, 1986). 

Já o método de estereotriangulação pode ser realizado de três formas, podendo 
ser analógico, semi analítico e analítico. Para a primeira classe, inicialmente devem 
ser realizadas manualmente orientações interior, relativa e absoluta em cada 
estereomodelo em todas as faixas de voo através do uso de estereoscópios, gerando 
longas faixas de pares fotogramétricos dos quais podem ser observadas diretamente 
as coordenadas dos pontos desejados. Já o método semi analítico consiste no 
desenvolvimento manual da orientação interior e relativa a partir do uso de 
estereoscópios, sendo a orientação absoluta executada numericamente e na posterior 
medição de coordenadas dos modelos. Por fim, a técnica analítica envolve 
primeiramente a medição de coordenadas na foto, seguida pelo ajuste numérico das 
orientações interior, relativa e absoluta através dos pontos de controle terrestres 
utilizados no processo (TAVARES; FAGUNDES, 1991). 

2.4 RESTITUIÇÃO 

A restituição do espaço é o termo utilizado para se referir à determinação da 
posição e orientação correta das várias imagens fotografadas baseada em medições 
realizadas nas imagens dos pontos de controle visíveis em cada foto. Para permitir 
que esse processo seja executado, é necessário a existência de, pelo menos, três 
pontos de controle por fotografia, dos quais sejam conhecidas as coordenadas 


horizontais e elevações e que não estejam dispostos de maneira próxima a uma linha 
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reta. Dessa maneira, a técnica mais comum para a realização da restituição é baseada 
no princípio da colinearidade dos raios fotogramétricos, cujas equações expressam a 
relação entre o centro de perspectiva, o ponto na imagem e o ponto no espaço do 
objeto disposto sobre uma linha reta (MARCHETTI; GARCIA, 1986; MOFFITT; 
MIKHAIL, 1980). 

Com a finalidade de permitir a restituição fotogramétrica de um modelo 
estereoscópico e, a partir dele, executar medições, é necessário que sejam feitas as 
orientações internas e externas das fotos. A recuperação da posição da imagem em 
relação à câmera possibilita que sejam reconstruídos os feixes perspectivos que 
geraram as fotografias. Em outras palavras, as características geométricas da 
orientação interior representam a posição do centro de perspectiva em relação ao 
sistema de coordenadas da fotografia e as distorções da lente do sensor. Assim, se 
uma foto é posicionada em relação à lente da câmera de modo que as três 
coordenadas do centro de perspectiva são corretamente recuperadas, os feixes que 
partem da lente serão idênticos aos que atingiram a câmera no momento da captura 
das imagens (ANDRADE, 1998; LEHMANN, 1975; TAVARES; FAGUNDES, 1991). 

Já a orientação exterior de uma foto se refere à determinação dos componentes 
que estabelecem a posição do centro e do eixo ótico em relação ao sistema referencial 
terrestre, normalmente no qual se deseja realizar o trabalho fotogramétrico. Para isso, 
existem seis parâmetros que devem ser determinados: as três translações que 
definem a posição do centro de projeção exterior da imagem (coordenadas do centro 
de exposição), ou seja, que sobrepõem as origens do sistema imagem e do sistema 
do objeto e as três rotações que estabelecem a orientação do feixe de raios da foto, 
isto é, que quando aplicadas permite a coincidência do sistema terrestre com o da 
fotografia (os ângulos de Euler). Desse modo, para orientar externamente um par 
estereoscópio, é necessário que sejam realizadas as reconstituições dos seis 
parâmetros de ambas as fotografias simultaneamente, totalizando doze elementos de 
orientação (ANDRADE, 1998; PAREDES, 1986). 

2.3 FOTOGRAMETRIA TERRESTRE 

A fotogrametria terrestre é o ramo da fotogrametria que utiliza imagens obtidas 
com câmeras localizadas na superfície terrestre, as quais podem estar acopladas a 
tripés, bastões, suspensas em torres ou escadas ou em outras plataformas. 
Usualmente nessa técnica os pontos de exposição são acessíveis, diferente de fotos 


aéreas, de modo que é possível determinar com precisão, por levantamentos 
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topográficos ou geodésicos, a sua posição espacial no sistema de referência 
desejado, bem como fixar ou medir a angulação da câmera, sendo muito comum que 
todos os parâmetros de orientação exterior sejam determinados em campo, 
dispensando a necessidade de calculá-los posteriormente. Desse modo, a realização 
de controle terrestre com o estabelecimento de pontos com coordenadas conhecidas 
pode ser parcialmente substituída pela definição desses elementos de orientação 
exterior (WOLF; DEWITT; WILKINSON, 2014). 

Quando a fotogrametria surgiu, esta ciência só podia ser aplicada na superfície 
da terra devido às restrições de equipamentos da época e por não existir plataformas 
que pudessem capturar fotos aéreas dos terrenos. Entretanto, com o surgimento do 
avião, os mapeamentos por fotos passaram a ser realizados majoritariamente por 
fotos aéreas, visto que possuem maior conveniência para projeção ortogonal em 
relação ao eixo Z, consequentemente facilitando a análise da elevação dos pontos, 
além de aumentar amplitude da área em que podem ser utilizadas. Nesse sentido, 
uma das principais destinações atuais do imageamento com câmeras terrestres se 
relaciona com a fotogrametria à curta distância, abrangendo diversas finalidades em 
outras áreas do conhecimento, como arqueologia (KHALAF et al., 2018), arquitetura 
(WERNER; SCHAFFALITZKY; ZISSERMAN, 2002), medicina (BAIRAK et al., 2019), 
odontologia (SANTOSI et al., 2018), entre outras. Ademais, em relação a aplicações 
topográficas, essa metodologia ainda é utilizada para situações como desfiladeiros 
profundos ou montanhas muito acidentadas, em que se torna difícil o levantamento 
com fotos aéreas (WOLF; DEWITT; WILKINSON, 2014). 

Em relação ao controle de campo para a fotogrametria terrestre, como os 
objetos podem estar dispostos cerca de centímetros de distância da câmera até 
centenas de metros, este pode ser executado de quatro formas distintas. A primeira 
consiste em realizar todo o controle através da fixação (ou determinação) da posição 
e orientação da câmera em relação ao sistema de coordenadas de referência do 
objeto. Dessa forma, como dito anteriormente, os seis parâmetros de orientação 
exterior são definidos em campo, dispensando a necessidade de serem calculados. 
Outra metodologia se refere ao uso de pontos de controle na superfície imageada, de 
forma análoga ao comumente executado na fotogrametria aérea, sendo os elementos 
de orientação interior e exterior obtidos indiretamente através da restituição 
fotogramétrica (MOFFITT; MIKHAIL, 1980). 
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Uma terceira técnica para executar o controle de campo é baseada no uso 
conjunto das duas anteriores, isto é, parte da orientação é estabelecida por meio do 
levantamento de campo e a presença de pontos de controle é utilizada para fortalecer 
a solução da geometria das fotos e permitir a verificação das medições, com o intuito 
de detectar possíveis erros. Por fim, também pode ser usado o método de controle 
apenas da escala, por meio de um sistema de coordenadas arbitrário cuja escala do 
modelo pode ser obtida através do conhecimento de uma ou mais distâncias 
conhecidas presentes no objeto fotografado. Assim, essas distâncias podem ser 
definidas através da medição entre pontos alvos da superfície ou do uso de barras de 
escala com comprimentos previamente estabelecidos (MOFFITT; MIKHAIL, 1980; 
WOLF; DEWITT; WILKINSON, 2014). 
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CAPÍTULO 03 


STRUCTURE FROM MOTION — MULTI VIEW STEREO 





Ao longo das décadas de 1960 e 1970 vários estudiosos de inteligência artificial 
e visão computacional desenvolveram pesquisas e avanços na área de 
processamento de imagens, incluindo aqueles que se voltaram para a percepção 
visual do movimento de superfícies (GIBSON, 1968; JOHANSSON, 1973; 
BÓRJESSON; VON HOFSTEN, 1973). Assim, Ullman (1979) traz que o problema 
principal dessa percepção, do ponto de vista computacional, é a interpretação da 
estrutura tridimensional e do movimento de um objeto através da análise de 
transformações bidimensionais de suas projeções, sem que nenhuma informação 
tridimensional seja conhecida, denominado de “Structure from Motion” (SfM). 

Nesse sentido, para solucionar essa questão, Ullman (1979) estabelece um 
algoritmo baseado em três etapas para eliminar as ambiguidades que surgem durante 
esse processo de restituição da geometria: agrupar as imagens em quatro elementos; 
verificar se esse conjunto possui uma única inferência como sendo um corpo rígido 
em movimento e, se sim, interpretá-lo como tal; incorporar os resultados obtidos no 
estágio anterior para inferir adequadamente a estrutura e o movimento do objeto 
analisado. 

Desse modo, pode-se dizer de forma simplificada que a técnica de SfM consiste 
em determinar, simultaneamente, a localização no espaço em que as imagens foram 
capturadas e a geometria dos elementos presentes nessas projeções, sem que seja 
necessário conhecer previamente pontos de controle com coordenadas 
tridimensionais para descobrir as posições das câmeras no momento de exposição e 
vice-versa (WESTOBY et al., 2012). Tais algoritmos permitem, então, que o processo 
de formação de modelos digitais de terrenos (MDTs) seja realizado através de um 
conjunto de imagens desordenadas e sem estruturas padrões obtidas por câmeras 
não métricas, que após a correspondência entre os vários pontos de exposição ser 
estabelecida pelo SfM, resulta em uma nuvem esparsa de pontos que pode ser 
densificada posteriormente por meio da ferramenta Multi-View Stereo (MVS) 
(STUMPF et al., 2014). 

Por desenvolver um processo automatizado e sem requerer a necessidade do 


rigor de geometria definida e calibração prévia da câmera na aquisição das fotografias, 
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uma das aplicações inicialmente utilizadas da técnica de SfM foi a reconstrução de 
superfícies por meio de imagens provenientes da internet, com o intuito de permitir a 
visualização tridimensional, através de um navegador, de locais ou monumentos de 
importância histórica e cultural, como o Coliseu (Roma), a Grande Muralha (China), 
o Monte Rushmore (EUA), a Catedral de Notre-Dame (Paris), entre outros 
(SNAVELY; SEITZ; SZELISKI, 2006, 2008; SNAVELY, 2008). 

Entretanto, com o aprimoramento dos algoritmos, simplificando o processo 
computacional e, consequentemente, agilizando o processamento dos dados, 
atrelado aos avanços tecnológicos na fotogrametria digital, foi perceptível o potencial 
desse método para diversas aplicações nas geociências, passando a ser explorado 
como uma forma alternativa para a realização de levantamentos de dados espaciais 
e geração de MDTs (SMITH; CARRIVICK; QUINCEY, 2016; STUMPF et al., 2014). 

Com o intuito de validar a precisão métrica e os produtos cartográficos 
derivados do uso da técnica de SÍM-MVS, pesquisadores das ciências geofísicas vêm 
realizando estudos comparativos com metodologias e instrumentos já consolidados, 
como receptores GNSS, Sistema de Escaneamento a Laser LIDAR e estações totais 
(FONSTAD et al., 2013; MICHELETTI; CHANDLER; LANE, 2015b; WESTOBY et al., 
2012). Dentre os fatores que influenciam a acurácia desses resultados, como a 
iluminação, a qualidade das imagens, a câmera e lente utilizada, provavelmente o 
mais importante é a distância para a superfície fotografada, sendo sugerida por James 
e Robson (2012) uma precisão relativa de 1:1000, isto é, erros de centímetros em 
observações realizadas a dezenas de metros do objeto. 

Nesse contexto, na última década podemos destacar, entre as aplicações 
nessa área, o uso de SfM-MVS para o monitoramento de questões ambientais como 
a análise de domos vulcânicos e do movimento da lava (JAMES; VARLEY, 2012; 
TUFFEN et al., 2013), a quantificação de perdas de solo e da erosão em voçorocas 
(CASTILLO et al., 2012; ELTNER et al, 2015), a investigação de falhas geológicas 
(JOHNSON et al. 2014; TAVANI; CORRADETTI; BILLI, 2016), o monitoramento de 
deslizamentos de terras (LUCIEER; JONG; TURNER, 2014; NIETHAMMER ET AL. 
2012;), estudos de geologia estrutural (BEMIS et al. 2014; VASUKI et al., 2014), 
observação de movimentos e medições glaciológicas (RYAN et al. 2015; 
WHITEHEAD; MOORMAN; HUGENHOLTZ, 2013), entre outras. 


3.1 RELAÇÃO COM A FOTOGRAMETRIA TRADICIONAL 

Dentre as diversas técnicas de levantamentos de dados espaciais para 
formação de modelos de elevação digitais (topografia clássica com estação total, 
receptores GNSS, imagens orbitais, LIDAR aéreo e terrestre e fotogrametria 
convencional) é notório afirmar que o método que inclui a utilização dos algoritmos 
de Structure from Motion e Multi- View Stereo possui maiores semelhanças nas etapas 
de execução do trabalho de campo, bem como das etapas de processamento, com a 
fotogrametria tradicional (SMITH; CARRIVICK; QUINCEY, 2016). 

Esse aspecto se deve ao fato de que muitos princípios inerentes à execução 
dos processos de SfM e MVS são derivados dos avanços tecnológicos e modelos 
matemáticos desenvolvidos pela fotogrametria ao longo das últimas décadas, como a 
condição de coplanaridade usada para relacionar as imagens espacialmente e o 
ajustamento de feixes (fototriangulação) usado para executar a condição de 
colinearidade que estabelece uma associação rigorosa entre as fotografias e os 
objetos (MICHELETTI; CHANDLER; LANE, 2015b). 

Entretanto, é importante frisar que a origem dessa metodologia também possui 
profunda ligação com os desenvolvimentos providos pela comunidade de visão 
computacional 3D e por esse motivo apresenta diferenças cruciais da fotogrametria 
tradicional ao longo do seu fluxo de trabalho, tornando-se um processo 
consideravelmente mais automatizado. Assim, a principal divergência entre essas 
técnicas é que, enquanto a fotogrametria convencional depende da obtenção de faixas 
paralelas de imagens sobrepostas, o SfM-MVS é capaz de restituir informações 
tridimensionais a partir de fotografias adquiridas sem estrutura geométrica, escala ou 
angulação fixas rigorosamente (WESTOBY et al., 2012). 

Ainda, segundo Fonstad et al. (2013), outra distinção entre tais métodos 
encontra-se na etapa do processamento na qual são inseridas as informações de 
coordenadas reais tridimensionais da superfície. As equações de colinearidade, que 
expressam a relação entre um objeto e sua projeção em uma imagem bidimensional, 
são resolvidas na fotogrametria tradicional após a introdução dos pontos de controle 
e seus respectivos parâmetros planialtimétricos, exigindo assim a visualização do 
mínimo de três destes pontos em cada fotografia ou conhecimento dos ângulos de 
rotação da câmera e sua posição espacial nos momentos de exposição (WOLF; 
DEWITT; WILKINSON, 2014). Já no caso do algoritmo de SfM-MVS as equações de 
colinearidade são sempre resolvidas antes da inserção de pontos de controle, visto 
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que a abundância de pontos conjugados permite que essa restituição ocorra em um 
sistema de coordenadas de escala arbitrária (FONSTAD et al., 2013). 

Portanto, um dos fatores fundamentais que motiva a utilização cada vez maior 
dos algoritmos de Structure from Motion atrelados aos de Multi-View Stereo para a 
geração de MDTs, apesar de apresentar dados espaciais menos precisos que a 
fotogrametria convencional, consiste na facilidade de sua aplicação, considerando que 
não requerer o rigor de planejamento e execução em campo de uma estrutura 
geométrica definida, nem o conhecimento a priori de coordenadas de pontos de 
controle ou de parâmetros da câmera. Desse modo, além de não exigir um 
conhecimento extremamente especializado, esse método também é 
consideravelmente menos onerosos devidos aos instrumentos necessários para sua 
realização serem simples e o processamento de seus dados ser mais automatizado 
(JAMES; ROBSON, 2012). 

3.2 PROCEDIMENTOS DE EXECUÇÃO 

Para que o processo de reconstrução das imagens ocorra de forma adequada, 
é necessário que sejam tomados cuidados no momento de aquisição das fotografias, 
tanto nos procedimentos de campo quanto na escolha da metodologia e 
equipamentos a serem utilizados para a realização do levantamento fotogramétrico. 

3.2.1 AQUISIÇÃO DA IMAGEM 

Devido aos avanços nos algoritmos de SfM-MVS existentes atualmente, uma 
grande variedade de modelos de câmera não-métricas pode ser empregada para a 
obtenção das fotografias em campo, destacando-se que o uso de câmeras não 
objetivas digitais (DLSR) com lente de distância focal fixa irão gerar cenas com maior 
qualidade e resolução. (MICHELETTI; CHANDLER; LANE, 2015b). Entretanto, isso 
não significa que em todos os casos serão gerados MDTs significativamente 
melhores, considerando que normalmente imagens obtidas com altas resoluções 
precisarão ser redimensionadas para evitar que o processamento seja 
excessivamente lento, reduzindo assim o nível de detalhamento da imagem 
(WESTOBY et al., 2012). 

Quanto à disposição dos pontos de exposição, é necessário que estes estejam 
bem distribuídos na área que se deseja representar tridimensionalmente, de modo a 
garantir que haja uma superposição adequada e que cada feição esteja presente em 
no mínimo três fotos. Além disso, recomenda-se que as imagens sejam adquiridas 


com diferentes escalas e angulações variadas, especialmente em locais que a 
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superfície é parcialmente encoberta por outros objetos ou por outra porção do próprio 
relevo. Para isso, inicialmente devem ser capturadas cenas mais abrangentes (menor 
escala) que representem toda a região desejada e em seguida, mais próxima dos 
objetos para garantir o nível de detalhamento requerido, bem como permitir imagear 
feições oclusas em outras perspectivas, como exemplificado pela Figura 03 
(MICHELETTI; CHANDLER; LANE, 2015b). 


Figura 03 — Aquisição de imagens. 
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Fonte: Micheletti, Chandler e Lane (2015b). 


Rauguste e Olsen (2013) também discutem a importância de observar a 
porcentagem de superposição que deve ser aplicada, por ser um dos fatores que mais 
influencia a qualidade do modelo gerado. Assim, é preciso realizar um planejamento 
para obter o máximo de fotografias possível, mas ponderando o fato de que quanto 
maior o conjunto de dados maior será o desempenho computacional exigido. Por isso, 
é indicado que a sobreposição esteja entre 70 e 90 % em contextos que se deseja 
alcançar precisões sub-métricas, pois valores inferiores não são suficientes para 
descrever a cena adequadamente e acima de 90 % não compensam o custo-benefício 
do tempo que será acrescido no processamento. Entretanto, quando a intenção é 
apenas reconstituir um objeto tridimensionalmente para fins de visualização, uma 


superposição de 40 a 50% pode vir a ser utilizada. 
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Também deve ser levado em consideração se a superfície possui textura 
apropriada para ser reconstituída com base nos algoritmos de SfM-MVS. Isso se deve 
ao fato de que identificadores automáticos de feições são baseados no 
reconhecimento de traços singulares em imagens superpostas, dessa forma, a 
presença de superfícies homogêneas, transparentes, reflexivas ou excessivamente 
planas e de porções cobertas por vegetação, areia ou neve, podem impedir os 
algoritmos de executar uma correta correspondência entre pontos. Outros fatores que 
influenciam negativamente esse processo incluem variações na iluminação (derivadas 
do deslocamento do sol, da movimentação de nuvens ou do próprio operador da 
câmera que podem causar sombras sobre o terreno) e de mudanças nos alvos (devido 
a movimentação de pessoas e veículos na frente das feições ou de sua alteração por 
conta de ventos que movimentam a vegetação, por exemplo), pois um mesmo objeto 
aparece diferente nas imagens, fazendo com que o algoritmo não associe como sendo 
a mesma forma (BEMIS et al. 2014). 

Ademais, é de extrema importância que as fotografias sejam obtidas do maior 
número de posições distintas possível, visto que a variação de direções origina um 
conjunto de imagens com geometria forte, importante para executar as etapas de 
restituição dos parâmetros da câmera e das coordenadas dos pontos. Contudo, é 
preciso ter em mente que a diferença de angulação entre imagens sobrepostas, se for 
muito grande, irá impedir que as feições sejam correlacionadas porque a textura irá 
ser distorcida de modo que não pareça a mesma. Assim, para mudanças no ponto de 
exposição superiores à 30º a capacidade de detecção pode cair drasticamente, 
portanto sendo recomendado que a angulação máxima das fotos seja em torno de 25 
a 30º (MOREELS; PERONA, 2006). 

3.2.2 PONTOS DE CONTROLE 

Para a obtenção das coordenadas dos pontos de controle, podem ser utilizados 
métodos e instrumentos de levantamento de informações tridimensionais já 
consolidados, como a estação total, os receptores GNSS por posicionamento relativo 
ou absoluto, imagens obtidas por fotogrametria tradicional, laser scanners terrestre ou 
aéreo ou mesmo por sensoriamento remoto proveniente de sensores orbitais. Por 
isso, a escolha da metodologia para determinação dos parâmetros espaciais dos 
pontos de controle dependerá da precisão na qual devem ser obtidos, podendo 
inclusive ser utilizado mais de um tipo de fonte de dados para a mesma aplicação 
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(FERRER et al., 2017; JAVERNICK; BRASINGTON; CARUSO, 2014; MICHELETTI; 
CHANDLER; LANE, 2015a) 

Quanto à materialização dos pontos de controle para posterior identificação nas 
fotografias, podem ser escolhidas feições do próprio local que sejam de fácil 
reconhecimento, por exemplo, meio-fio, sinalização horizontal de rodovias, esquinas 
de quadras e detalhes arquitetônicos em regiões urbanizadas (DANDOIS; ELLIS, 
2010; JAMES; APPLEGARTH; PINKERTON, 2011). Contudo, em circunstâncias que 
não existam pontos suficientemente distinguíveis da textura geral da cena, ou mesmo 
quando se tem a intenção de evitar prováveis ambiguidades e associações errôneas 
e garantir maior precisão na aquisição das coordenadas, são implantados marcos 
artificiais com centroides bem definidos, de modo que possam ser facilmente 
detectados posteriormente (CASTILLO et al. 2015; NIETHAMMER et al. 2012; 
WESTOBY et al., 2012). 

3.2.3 PLATAFORMAS PARA IMPLANTAÇÃO DA CÂMERA 

Por ser um objeto normalmente leve, ao contrário de instrumentos como o 
LIDAR, existem diversas opções de plataformas nas quais podem ser equipadas as 
câmeras para fotografar determinada superfície. Essa escolha também deve estar 
diretamente ligada às especificações de cada caso, dependendo principalmente da 
extensão da área a ser imageada e da escala em que se deseja obter as cenas, isto 
é, da distância média da superfície em que devem ser capturadas (MICHELETTI; 
CHANDLER; LANE, 2015b; SMITH; CARRIVICK; QUINCEY, 2016). 

Na fotogrametria as plataformas tradicionais, como aviões, são muito caras, 
podendo inviabilizar a execução do levantamento em certos contextos. Nesse sentido, 
para aplicações de curto-alcance que exigem precisões posicionais em torno de 
decímetros ou centímetros, surgiram outras plataformas mais leves, menos onerosas 
e muitas das quais podem ser construídas pelos próprios profissionais que as utilizam. 
No caso de fotogrametria aérea, podem ser usados objetos não tripulados como pipas, 
balões, dirigíveis, aeromodelos e drones, principalmente em locais de difícil acesso. 
Já em situações que a porção fotografada é pequena e o nível de detalhamento 
requerido exige que as imagens sejam obtidas com escala maior, a câmera pode ser 
acoplada em mastros, postes ou mesmo ser usada diretamente pelo operador 
(JAMES; ROBSON, 2012, 2014; WESTOBY et al., 2012). 
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3.2.3.1 PLATAFORMAS AÉREAS 

A utilização de câmeras digitais em pipas é comumente chamada de Fotografia 
Aérea com Pipa - KAP (Kite Aerial Photography). Essa técnica apresenta a vantagem 
de ser facilmente transportável devido à leveza e o tamanho, além de ser 
relativamente barata quando comparada a outras plataformas e poder ser controlada 
por uma linha presa a um carretel (Figura 04). Por esse motivo vem sendo empregada 
em vários estudos na geração de modelos tridimensionais para mapeamento 
(BRYSON et al., 2013; CURRIER, 2015), estudo de vegetação (DANDOIS; ELLIS, 
2010), monitoramento de voçorocas (MARZOLFF: RIES; ALBERT, 2002), estudos de 
diferentes tipos de terrenos (SMITH; CHANDLER; ROSE, 2009), e análises de 
geomorfologia periglacial (BOIKE; YOSHIKAWA, 2003), bem como aplicações para 
arqueologia (SCHLITZ, 2004). O principal ponto desfavorável da KAP é que a 
velocidade do vento no local deve ser estável, uma vez que ventos inconstantes 
impedem uma superposição regular entre as imagens e, consequentemente, uma 
cobertura adequada para fotogrametria (GREEN; BEVAN; SHAPLAND, 2014). 


Figura 04 — Câmera acoplada à pipa. 





Fonte: Smith, Chandler e Rose (2009). 
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Em relação aos balões de hélio e dirigíveis (Figura 05), seu uso é recomendado 
devido à simplicidade de trabalhar com essa plataforma e por ser mais fácil de 
posicionar a câmera lateralmente e na altitude desejada do que a pipa, entretanto, 
podendo ser guiado por uma só pessoa apenas em condições de vento moderado, 
visto que a presença de um segundo operador melhora a eficiência de imageamento 
da área e torna-se indispensável em condições atmosféricas adversas (JOHNSON et 
al., 2014). Quanto ao uso de dirigíveis, a utilização de Helikites, combinação de um 
balão de hélio e pipa desenvolvido pela empresa Alisopp Helikites, vem sendo 
validada por pesquisadores das geociências (FONSTAD et al., 2013; VERICAT etal., 
2018) devido a facilidade de ser orientado por uma única pessoa através da corda 
leve ligada ao aparelho e uma bobina. Contudo, as maiores desvantagens da 
utilização desse método consistem na dificuldade de transportar essa plataforma para 
áreas remotas e no custo relativamente alto do hélio, necessário para manter o balão 
no ar (BOIKE; YOSHIKAWA, 2003). 


Figura 05 — Balão equipado com câmera. 
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Fonte: Johnson et al. (2014). 


Ainda para a fotogrametria aérea, o uso de aeromodelos e, principalmente, de 
drones (Figura 06) vem sendo cada vez mais consolidado para realizar a modelagem 
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tridimensional de superfícies (QU; HUANG; ZHANG, 2018; ROSNELL; 
HONKAVAARA, 2012). Denominados Veículos Aéreos Não Tripulados (VANTS), 
esses instrumentos são normalmente controlados remotamente por rádio ou podem 
ser programados para voar conforme uma rota previamente planejada, requerendo 
pouca interferência do piloto (JOHNSON et al., 2014). Quando comparados a outras 
plataformas, esses aparelhos apresentam melhor padronização da cobertura da 
superfície imageada, transporte mais facilitado inclusive em regiões de difícil acesso 
devido ao tamanho pequeno do equipamento e seu uso é menos influenciado por 
condições temporais, sendo por isso amplamente aplicado em estudos geodésicos. 
Entretanto, a desvantagem da utilização de drone em relação às demais plataformas 
citadas é relacionada ao seu custo mais alto e necessidade de regularização para usa 
utilização segundo as normas de cada país (BEMIS et al., 2014; ELTNER et al, 2015; 
NIETHAMMER et al., 2012; RYAN et al., 2015; VASUKI et al., 2014). 


Figura 06 — Câmera acoplada a VANT. 





Fonte: Rosnell e Honkavaara (2012). 


3.2.3.2 PLATAFORMAS TERRESTRES 

Quando a representação tridimensional desejada consiste em fachadas de 
edificações, objetos isolados ou áreas com extensão longitudinal por volta de dezenas 
de metros pode ser utilizada a fotogrametria terrestre para imagear essas superfícies. 
Para isso, um dos instrumentos no qual pode ser acoplada uma câmera são mastros 
ou bastões telescópicos (Figura 07) com o intuito de capturar fotografias aéreas 
oblíquas de baixa altitude em complemento a imagens obtidas apenas no solo 
(MATHEWS; JENSEN, 2012). Além disso, são equipamentos baratos, com bom 
custo-benefício, portáteis e que também podem ser utilizadas como plataformas 
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aéreas, com a desvantagem que a altura de imageamento fica restrita a 15-20 metros 
(VERHOEVEN, 2009). 


Figura 07 — Bastão telescópico com câmera. 


Fonte: Mathews e Jensen (2012). 
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Outra variação desses bastões, são bipés, tripés e quadripés telescópicos, os 
quais conferem melhor estabilidade para câmeras em fotografias terrestre, evitando o 
efeito de arrastamento que pode interferir na qualidade da cena e garantindo a 
horizontalidade de seu eixo em relação ao solo (FERNANDES, 2010; PALERMO; 
LEITE, 2013). Dentre esses, normalmente o tripé é mais utilizado para diversas 
aplicações em fotogrametria terrestre porque é mais estável que o bipé e mais fácil de 
ser encontrado no mercado que o quadripé (BASTIAN, 2015; CENTENO; WUTKE; 
KERSTING, 2004; HASHIM et al. 2012; JAMES; ROBSON, 2012). 

Por ser uma técnica que não exige rigor posicional no momento de captura da 
imagem como na fotogrametria convencional, o SÍM permite também que as cenas 
sejam adquiridas sem o uso de nenhuma plataforma, ou seja, diretamente das mãos 
do fotógrafo. Apesar de ser limitado ao uso em áreas pequenas e em contextos que 
não precisem de imagens capturadas de perspectivas aéreas, podendo ser 
inteiramente obtidas a partir do solo, essa possibilidade permite maior liberdade de 
operação já que não exige o transporte de equipamentos e mão de obra especializada, 
além de não ter custo adicional de plataformas. Contudo, como não proporcionar 
nenhum tipo de estabilidade externa, a precisão final do modelo pode ser 
comprometida pela presença de arrastamento nas fotografias, requerendo maior 
cuidado durante o levantamento (MICHELETTI; CHANDLER; LANE, 2015a, 2015b; 
MILLER; MORGENROTHB; GOMEZ, 2015). 

3.2.3 SOFTWARES 

Existem diversas ferramentas para processamento de imagens com o uso de 
algoritmos de SfM-MVS, incluindo serviços online, softwares gratuitos de código 
aberto e pacotes comerciais. A Tabela 01 apresenta as principais plataformas de 
aplicação dessa abordagem disponíveis atualmente. A escolha do programa a ser 
utilizado depende diretamente das especificações e requisitos computacionais 
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disponíveis, bem como do tipo de aplicação a qual se destina o serviço realizado, isto 


é, que análise deseja ser executada no produto gerado através desse processamento 
e com que nível de profundidade (MICHELETTI; CHANDLER; LANE, 2015b). 


Tabela 01 — Principais softwares que utilizam algoritmos de SfM-MVS. 

















Toolbox (PPT)>» 


SOFTWARE OBSERVAÇÕES 

GRATUITOS 

Bundler 

Photogrammetry Sem interface gráfica do utilizador. Disponível apenas para Windows. 
Package?» 

SFMToolkit3% » Similar ao Bundler Photogrammetry Package. 

Python ds Ee j E ne ear 
Photogrammetry Interface gráfica ao usuário e scripts em Python, com distribuição em 


Linux. 





VisualSFM? 


Interface gráfica ao usuário avançada para Windows, Linux e Mac. 
Com opção de georreferenciamento, mas modelo de câmera é mais 
restrito que no Bundler. 





3DF Samantha 


Apenas SfM, mas com modelos mais avançados de câmera que os 
demais softwares livres. Formas de exportção compatíveis com vários 
algoritmos de densificação. 





SERVIÇOS ONLINE 





Desenvolvido a partir do Bundler. Apenas SÍM, sem densificação. 





Photosynih Incorpora uma grande variedade de imagens, mas a custo da acurácia 
da resconstrução. 
Arc3D Usado principalmente para projetos de patrimônios culturais 





CMP SfM Web service? 





Autodesk 123D Catch 


Opções de pós-processamento limitadas. Usado em aplicações 
geofísicas 


























Pix4D Também disponível como software offline. 

My3DScanner 

Mieifao Apresenta o fluxograma completo de SIM-MVS, com modelos 
complexos dos parâmetros instrísecos da câmera. 

Ecosynth Usado para mapeamento de vegetação. 

COMERCIAIS 

Photoscan/Metashape | Pacote comercial completo para aplicação de SfM-MVS. 

Acute3D 

Phetolodéler Originalmente criado para fotogrametria à curta distância que 


incorporou a implementação de SÍM. 








3DF Zephyr Pro 





Mecanismo subjacente para SfM é o 3DF Samantha. 








Fonte: Adaptada de Bemis et al., 2014 e Smith, Carrivick e Quincey (2016). 
Notas: *Usa Bundler (http://www.cs.cornell.edu/-snavely/bundler/) para computar o SÍM. 
Usa Patch-based Multi-view Stereo (https:/Aww.di.ens.fr/pmvs/) para computar o MVS. 
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No referente à estudos voltados para as geociências, podemos destacar 
exemplos da utilização do SFMToolkit3 por Westoby et. al (2012), do Bundler 
Photogrammetry Package por James e Robson (2012), do Autodesk 123D Catch por 
Micheletti, Chandler e Lane (2015a), do VisualSfM e do Micmac por Stumpf et al. 
(2014), do Ecosynth por Dandois e Ellis (2010), do Photosynth por Rosnell e 
Honkavaara (2012) e do Agisoft Photoscan por Lucieer, Jong e Turner (2014), Tavani, 
Corradetti e Billi (2016), Javernick, Brasington e Caruso (2014) e Fonstad et al. (2013). 

Dentre as plataformas citadas, é importante ressaltar que alguns serviços 
online foram removidos da internet pelos seus desenvolvedores e não se encontram 
mais disponíveis para uso, como o Photosynth, o Autodesk 123D Catch e o 
MySDScanner, além do software livre Bundler Photogrammetry Package. 

3.3 ETAPAS DE PROCESSAMENTO 

Por apresentar diversos algoritmos e formas distintas para a resolução da 
questão central do SfM-MVS (identificar objetos tridimensionais através de imagens 
obtidas de diferentes perspectivas ou de um sensor com movimento irregular), as 
etapas de processamento dos dados no uso dessa aplicação geralmente variam 
conforme o(s) software(s) utilizado(s), contudo conservando aspectos fundamentais 
entre si que norteiam o fluxo de trabalho a ser realizado e encontram-se presentes ao 


longo de seu desenvolvimento, como mostra a Figura 08 (STUMPF et al, 2014). 
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Figura 08 — Fluxograma padrão do SfM-MVS 
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Fonte: Adaptado de Smith, Carrivick e Quincey (2016). 


Nesse sentido, podemos dividir a geração de modelos de elevação do terreno 
através de imagens interpretadas por meio deste método em sete passos principais: 
identificação de feições, correspondência de pontos de interesse reconhecidos em 
múltiplas fotografias, detecção de relações geometricamente consistentes, execução 
dos algoritmos de Structure from Motion para a solução da estrutura tridimensional, 
georreferenciamento e escala do modelo, refinamento dos parâmetros e utilização dos 
algoritmos de Multi-View Stereo para densificação da nuvem de pontos (SMITH; 
CARRIVICK; QUINCEY, 2016). 

3.3.1 RECONHECIMENTO DE FEIÇÕES 

Inicialmente o conjunto de fotos inseridas nos softwares de processamento com 
SfM-MVS irá ser submetido a um reconhecimento de feições, as quais serão 
associadas a um identificador único, independente da rotação ou escala da imagem 
analisada, sendo este processo consideravelmente facilitado com a correção de 
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distorções nas imagens e a normalização geométrica do local onde está presente a 
feição (SNAVELY, 2008). 

Em outras palavras, o processo de procura e identificação de feições 
correspondentes nas imagens consiste nos seguintes passos principais: 
primeiramente pontos são selecionados em localizações salientes como interseções 
e cantos; em seguida a vizinhança dessas feições é caracterizada por um vetor, que 
deve ser de fácil diferenciação e ao mesmo tempo pouco influenciado (robusto) por 
ruídos, deformações geométricas e identificações errôneas, porque esses vetores são 
associados em cenas diferentes (BAY et al., 2008). 

Assim, existem diversas técnicas para realizar esse processo de identificação, 
como SIFT (Scale Invariant Feature Transform) proposta por Lowe (1999), SURF 
(Speeded-Up Robust Features) por Bay et al. (2008), BRIEF (Binary Robust 
Independent Elementary Features) por Calonder et al. (2010) e LDAHash (Linear 
Discriminant Analysis) por Strecha et al. (2012). Tais metodologias são baseadas na 
mesma sequência de etapas, variando, entretanto, a forma de reconhecimento das 
feições, sua capacidade de repetitividade para detecção de pontos em diferentes 
condições, as características dos identificadores (vetores) gerados, sua robustez, 
entre outros fatores que influenciam a qualidade da análise realizada e a velocidade 
do processamento. 

Nesse sentido, apesar de terem sido desenvolvidos vários métodos após a 
criação da SIFT, com o intuito de diminuir o desempenho computacional exigido e 
agilizar a execução dessa etapa, esse ainda continua sendo o mais utilizado dentro 
do fluxograma do SfM-MVS por ser mais eficaz em identificar feições em cada 
fotografia que são invariantes a rotação e escala e parcialmente a mudanças 
angulares na perspectiva das imagens e condições de iluminação, tendo se mostrado 
eficiente na detecção de objetos com variação de até 40º nas perspectivas das 
imagens (SMITH; CARRIVICK; QUINCEY, 2016). 

Assim, um dos motivos para o melhor desempenho dessa abordagem é que 
são realizadas transformações nos gradientes das cenas que as tornam amplamente 
insensíveis a variações na luminosidade e diferentes angulações, permitindo então 
que os pontos de interesse sejam reconhecidos automaticamente dentre todas as 
cenas importadas e associados a um vetor identificador único (LOWE, 2004). 
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3.3.2 CORRESPONDÊNCIA DE FEIÇÕES 

Durante a análise de um arranjo de fotografias, geralmente todos os pontos de 
interesse não são retratados por todas as imagens, por isso é necessário utilizar 
vetores para descrevê-los e estabelecer um limite no qual seja verificado a existência 
de relações entre as feições. Para isso, é determinado um valor mínimo para o raio 
baseado na distância euclidiana desses vetores de pontos vizinhos mais próximos, de 
modo a potencializar as chances de que as associações sejam adequadamente 
realizadas pelo software (SMITH; CARRIVICK; QUINCEY, 2016). 

A metodologia de SIFT foi assim denominada por transformar os dados das 
fotografias em coordenadas invariáveis, independente da escala, relacionadas às 
feições locais (Figura 09). Seu processo consiste em extrair pontos identificáveis de 
um conjunto de imagens e armazená-los em um banco de dados e, posteriormente, 
comparar individualmente as feições de uma nova foto a esses pontos presentes no 
banco. Assim, por serem extremamente distintos, existe uma alta probabilidade 
desses pontos reconhecidos serem corretamente associados mesmo em conjuntos 
com grande volume de imagens (LOWE, 1999; SNAVELY, 2008). 


Figura 09 — Conjunto de feições identificadas pelo SIFT. 





No entanto, esse processo pode requerer alto desempenho computacional por 


ser muito complexo quando é exigida uma solução exata de vetores com várias 
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dimensões. O algoritmo de SIFT, por exemplo, apresenta grande diferenciação porque 
é capaz de armazenar informações radiométricas (intensidade de cores) da 
vizinhança das feições com até 128 dimensões (BROWN; LOWE, 2005; 
LOWE, 2004). 

Por isso, comumente são usadas técnicas para particionar esses dados de 
modo a acelerar essa etapa e demandar menos desempenho dos hardwares. Além 
disso, no método SIFT, as amostras de feições extraídas das imagens de maior 
escala, por possuírem maior nível de detalhamento, recebem maior peso das geradas 
através das fotos de menor escala no processo de comparação com as demais 
fotografias, bem como são usadas para filtrar as feições de modo a identificar quais 
são os vizinhos mais prováveis nas imagens capturadas com maior linha de base, 
auxiliando no processo de relacionamento de seus pontos (LOWE, 1999). 

3.3.3 DETECÇÃO DE RELAÇÕES GEOMETRICAMENTE CONSISTENTES 

Após executada a comparação e associação das feições na etapa anterior, é 
imprescindível que seja averiguado se houve correspondências realizadas 
erroneamente para que estas possam ser corrigidas ou removidas. Como exemplos 
dos parâmetros estatísticos mais utilizados para a verificação de dados anômalos 
podem ser citados: Menor Mediana dos Quadrados dos Resíduos (MMQ), RANSAC 
(Random Sample Consensus em inglês) e a Transformação de Hough (LOWE, 2004). 

O tratamento estatístico de dados pelo método clássico de minimização da 
soma dos quadrados dos resíduos, proposto por Gauss e denominado de Métodos 
dos Mínimos Quadrados ou Mínimos Quadrados Ordinários (MQO) é considerado um 
critério para análise de observações confiáveis e precisas e se tornou um dos pilares 
da análise estatística. Entretanto, na aplicação de SfM-MVS, dificilmente irão existir 
conjuntos de dados ideais que cumpram com as hipóteses necessárias para que essa 
modelagem funcione como previsto na teoria, de modo que um único dado 
discrepante pode ter grande influência na estimativa de uma distribuição através do 
MQO e por isso vários autores vêm discutindo alternativas para substituí-lo pelos 
chamados estimadores robustos, que são menos sensíveis à presença de 
observações anômalas (ROUSSEEUW, 1984). 

Normalmente, em análises de imagens com visão computacional, os detectores 
de feições podem cometer erros de medição, quando os pontos são devidamente 
identificados, mas algum de seus parâmetros (como sua localização espacial na cena) 
são calculados com pequenas discrepâncias, e de classificação, quando a ocorrência 
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de pontos é reconhecida incorretamente. Para o caso dos erros relacionados às 
propriedades métricas dos pontos, sua distribuição segue a distribuição normal na 
maioria dos casos, contudo, as classificações realizadas de forma incorreta são erros 
grosseiros, que afetam de forma mais expressiva a interpretação das projeções nas 
fotografias e que não possuem padronização estatística. Por esse motivo, os modelos 
clássicos de estimadores como o MQO não são recomendados para aplicações 
referentes à análise de imagens com dados provenientes de identificadores de feições 
automáticos, como é o caso do SfM-MVS (FISCHLER; BOLLES, 1980; MEER; MINTZ; 
ROSENFELD, 1991). 

Assim, novos parâmetros estatísticos foram desenvolvidos derivados do MQO 
com o intuito de trabalhar com conjuntos de dados que possuam maiores informações 
discrepantes sem que isso interfira de forma significativa na análise estatística. Uma 
dessas alternativas é a substituição do quadrado dos resíduos por seu valor absoluto 
(módulo), contudo o uso do método de Menor Mediana dos Quadrados dos Resíduos 
(MMQ) ganhou bastante visibilidade por abranger a possibilidade de trabalhar com até 
50% das observações contaminadas sem que o estimador assuma valores muito 
discrepantes do ideal (MASSART et al., 1986; ROUSSEEUW, 1984) 

Outro exemplo de critério muito utilizado para estudos com identificação de 
estruturas tridimensionais a partir de imagens digitais é o RANSAC. Analisando certo 
número de observações, em vez de selecionar um maior conjunto de pontos para 
chegar a uma solução provisória e posteriormente eliminar os dados que parecem ser 
inválidos, o processo básico desse estimador consiste em usar inicialmente um 
subconjunto aleatório com o mínimo de dados para solucionar o modelo e, quando for 
possível, expandir esse conjunto com as observações consistentes, realizando, por 
fim, o ajustamento baseado em dados providos apenas de erros de medição. De forma 
similar ao MMQ, o uso desse estimador também é adequado para casos em que até 
metade da amostra de dados analisadas seja provida de erros grosseiros (FISCHLER; 
BOLLES, 1980). 

Além dessas aplicações, em situações que devem ser reconhecidos objetos 
pequenos ou que estão quase completamente ocultos, tais superfícies precisam ser 
identificadas com o mínimo possível de correspondências de feições, sendo 
necessário que sejam modeladas com conjuntos de associações com mais de 99% 
de dados errôneos. Para ser capaz de trabalhar com esses casos, Lowe (2004) traz a 


possibilidade de utilizar a transformação proposta por Hough (1962), na qual a 
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imagem é dividida em grupos tão pequenos que uma textura complexa é transformada 
em segmentos de reta, de modo que cada um desses conjuntos indica uma posição 
do objeto que seja consistente com essas feições. Assim, quando mais de um grupo 
determinar a mesma posição, existe uma probabilidade consideravelmente maior de 
que essa correspondência esteja correta do que se fossem analisados pontos 
individualmente. 

Portanto, a escolha de qual modelagem estatística das imagens de uma 
superfície é mais adequada para determinado caso específico irá depender 
principalmente da qualidade das fotografias adquiridas, da aplicação para a qual serão 
utilizadas, da frequência de ruídos ou fatores que possam levar a interpretações 
errôneas da forma dos objetos projetados (a exemplo da iluminação), da presença de 
superfícies parcialmente ocultas, do nível de detalhamento tridimensional que deve 
ser extraído das cenas, a origem e o tipo de erros presentes nos dados analisados, 
bem como a forma que se comportam e a probabilidade de existirem dados anômalos 
na distribuição (MEER; MINTZ; ROSENFELD, 1991) 

3.3.4 SOLUÇÃO DA ESTRUTURA TRIDIMENSIONAL 

Com a detecção, correspondência e tratamento estatístico das feições já 
executadas nas imagens da superfície analisada, pode-se finalmente dar início à 
etapa do fluxograma correspondente à resolução do problema do Structure from 
Motion. Em outras palavras, nesse momento ocorrerá a reconstituição simultânea da 
posição da câmera, de seus parâmetros e da geometria dos objetos sem que seja 
requerido o conhecimento de nenhuma dessas informações inicialmente, cujo produto 
final consiste em uma nuvem de pontos esparsa gerada com escala e sistema de 
coordenadas arbitrárias (WESTOBY et al, 2012). 

Primordialmente, a questão intrínseca ao SfM consiste em resolver uma 
estrutura a partir de um conjunto de imagens sem que haja nenhum dado 
tridimensional que possa identificar as superfícies presentes. Isso significa que irão 
existir infinitas soluções de movimentos sofridos pelos objetos descritos por essas 
cenas. Com o intuito de eliminar essa ambiguidade e definir uma solução única para 
essa situação, a qual seja possível assumir como correta em quase todos os casos, 
Ullman (1979, p. 409, tradução nossa) propõe a denominada suposição de rigidez: 
“qualquer conjunto de elementos submetidos a uma transformação bidimensional que 
possui uma única interpretação como um corpo rígido se movendo no espaço, deve 


ser interpretado como tal”. 
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A partir desse princípio, surge então a necessidade de incorporá-lo a um 
esquema que irá corretamente inferir a geometria do objeto analisado. Assim, a versão 
mais simples do problema do SfM envolve apenas duas imagens, cujas posições das 
câmeras e coordenadas relativas das superfícies podem ser determinadas com a 
associação de no mínimo cinco pontos presentes em ambas, ocorrendo de forma 
análoga para casos com três cenas e o uso de quatro pontos não coplanares. No 
entanto, para um conjunto de várias imagens essa solução torna-se mais complexa, 
existindo então diversos algoritmos desenvolvidos para essa finalidade (SNAVELY, 
2008; ULLMAN, 1979). 

Uma situação em que as fotografias são obtidas através de uma sequência 
específica, como através da extração de frames de um vídeo, por serem imagens 
necessariamente consecutivas podem ser analisadas em pares, de modo que nas 
duas primeiras são utilizados os cincos pontos não coplanares para restituir a posição 
dos demais através de triangulação e dos pontos de exposição e, posteriormente, 
incorporar os demais frames. O uso dessa técnica, entretanto, é limitado para casos 
em que a câmera utilizada esteja devidamente calibrada e a sequência de cenas não 
seja muito extensa, bem como não formem circuitos circulares, ou seja, que em dado 
momento sofram /oopings e voltem para o mesmo local (SNAVELY, 2008). 

Já o método de fatorização requer que as fotografias utilizadas apresentem 
uma projeção ortográfica, ou seja, o componente de movimentação referente à 
translação da câmera ao longo do eixo ótico não pode ser reconstituído por essa 
abordagem e, por isso, deve ser consideravelmente pequeno quando comparado à 
extensão imageada. Apesar disso, essa limitação permite que a qualidade do 
reconhecimento das formas e dos cinco parâmetros de movimentação remanescente 
melhore substancialmente. O uso dessa técnica consiste basicamente em representar 
uma sequência de imagens como uma matriz de observações composta pelas 
coordenadas verticais e horizontais dos pontos reconhecidos em determinado número 
de cenas, de modo que, se tais coordenadas forem medidas a partir do centroide dos 
objetos, esta pode então ser fatorada como o produto de duas matrizes: uma referente 
a rotação da câmera e outra à forma da superfície retratada (TOMASI; 
KANADE, 1992). 

Dentre as restrições desse método, tem-se que foi desenvolvido para ser 
aplicado apenas para modelos ortográficos, podendo ser usado em imagens com 


perspectiva, mas sem que haja uma resolução direta da geometria. Outra ressalva é 
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que, para que a matriz de medições seja preenchida completamente (permitindo que 
esta seja fatorada de modo direto) é necessário que todos os pontos sejam visíveis 
em todas as imagens. Entretanto, na maioria dos casos práticos, não é possível 
identificar algumas feições devido à presença de oclusões, sendo propostos 
algoritmos iterativos para solucionar esse problema. Além disso, incluir estimadores 
robustos no modelo de fatorização normalmente é um processo indispensável quando 
existem índices elevados de dados anômalos presentes nas observações, entretanto 
que se torna complexo e que diminui a qualidade dos dados (BUCHANAN; 
FITZGIBBON, 2005; SNAVELY, 2008). 

Nesse contexto, com o intuito de utilizar uma técnica de resolução da estrutura 
geométrica e dos parâmetros dos pontos de exposição que pudesse ser aplicada em 
situações mais genéricas, o método de ajustamento de feixes (bundle adjustment em 
inglês) é amplamente aplicado. Essa denominação surge por conta dos feixes de raios 
de luz que partem de cada ponto tridimensional e convergem para o centro das 
câmeras, sendo assim refinados simultaneamente em relação à variação da 
geometria e das propriedades da cena. Além disso, esse processo ocorre por meio da 
otimização do ajustamento de forma que a reconstituição estimada dessas 
informações seja realizada através da minimização das funções de custo que 
quantificam a modelagem dos erros, isto é, do desempenho computacional exigido 
(TRIGGS et al., 2000). 

Uma das principais vantagens dessa metodologia consiste na amplitude de 
aplicações que pode ser usada, incluindo diversos tipos de fontes de dados, câmera, 
cenas, feições e estimadores, bem como não apresenta problema em casos de pontos 
oclusos ou associados incorretamente. Ademais, apresenta altos índices de acurácia 
e eficiência devido ao desenvolvimento de um bom método de controle de qualidade 
e de algoritmos que podem ser executados mesmo em casos complexos ou com 
grande volume de fotografias. O ajustamento de feixes pode ser utilizado inclusive 
para reconstituir a trajetória da câmera em gravações de vídeo em tempo real, 
prevenindo o que os erros sejam propagados e acumulados no processo. Por isso, 
esse método vem se consolidando como a principal técnica para realizar a etapa de 
reconstrução geométrica inicial e estimação dos parâmetros de rotação, translação e 
calibração da câmera (ENGELS; STEWÉNIUS; NISTÉR, 2006; TRIGGS et al., 2000). 
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3.3.5 ESCALA E GEORREFERENCIAMENTO 

Como a nuvem esparsa de pontos gerada na etapa de SÍM é obtida com escala 
e coordenadas espaciais arbitrárias, é necessário que essas propriedades sejam 
transformadas para o sistema de referência desejado. Para contextos nos quais o 
referenciamento não é relevante, esse produto pode ser apenas submetido à escala, 
sendo então necessário o conhecimento de pelo menos uma distância real presente 
ao longo das cenas retratadas, mas geralmente recomenda-se a inserção de mais 
observações, de modo que os erros possam ser minimizados nesse processo. 
Entretanto, quando é imprescindível que o modelo esteja associado a um sistema 
específico (por exemplo, a um datum geodésico), deve-se ter o conhecimento de no 
mínimo três pontos com coordenadas nesse sistema para que possam ser resolvidos 
os três parâmetros de rotação e três de translação global. Em situações que deva ser 
executada a submissão à escala e o georreferenciamento, normalmente são utilizados 
mais que três pontos de controle, também com o intuito de tratar estatisticamente os 
dados fornecidos (JAMES; ROBSON, 2012). 

Nesse sentido, para determinar a quantidade de pontos que devem ser 
medidos no local estudado, alguns requisitos como a extensão da área, a precisão 
exigida, a distância da câmera em relação à superfície fotografada e a finalidade à 
qual será aplicada essa técnica precisam ser considerados e, portanto, analisados 
para cada conjuntura de modo individual. É notório que essas transformações serão 
mais fidedignas se tais pontos estiverem bem distribuídos e encobrirem todo o setor 
imageado, no entanto, ao contrário da fotogrametria clássica, não há a necessidade 
da presença de pontos de controle em cada fotografia, visto que tais coordenadas são 
exigidas apenas para georreferenciar o produto tridimensional e não para resolver as 
equações de colinearidade (FONSTAD et al., 2013; SMITH; CARRIVICK; 
QUINCEY, 2016). 

Alternativamente, a etapa de georreferenciamento pode ser desempenhada 
antes do processo de reconstrução da estrutura tridimensional, por meio do uso de 
informações referentes ao posicionamento dos pontos de exposição no momento de 
aquisição das imagens, os quais podem ser obtidos por receptores GNSS acoplados 
as câmeras. Nessa conjuntura, o processo de SfM é executado com informações 
tridimensionais estimadas que auxiliam na formação da nuvem esparsa e, 


posteriormente, são usados os dados dos pontos de controle para melhor ajustar o 
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posicionamento do modelo em relação às coordenadas do sistema ao qual se deseja 
referenciar (VIANA et al. 2018). 

3.3.6 REFINAMENTO DOS PARÂMETROS 

Como forma de alcançar resultados mais precisos, após a efetivação do 
georreferenciamento, é opcional que os dados tridimensionais dos pontos inseridos e 
reconhecidos sejam usados para refinar ainda mais a restituição da geometria do 
modelo e dos parâmetros de orientação (internos e externos) da câmera, uma vez que 
se tornam uma nova fonte de informações a respeito dos erros na minimização da 
função de custo durante o processo de SfM. Assim, com esses dados adicionais, a 
etapa de geração da nuvem esparsa de pontos pode ser realizada novamente, 
otimizando o alinhamento das fotografias e reduzindo os erros de 
georreferenciamento e reprojeção da nuvem esparsa de pontos (SMITH; CARRIVICK; 
QUINCEY, 2016). 

Essa otimização é importante nos casos em que se deseja utilizar o produto 
final (MDT) para mensurações, como é o caso para aplicações geodésicas. Isso se 
deve ao fato de que as características relativas à rotação, translação e escala das 
câmeras definidas anteriormente só se encontram aptas a corrigir erros lineares, ou 
seja, as deformações não lineares que podem ter sido originadas no processo de 
reconstrução geométrica permanecem mesmo após a inserção dos pontos de 
controle. Por isso, recomenda-se que esse refinamento seja executado com o intuito 
de garantir uma melhor precisão dos dados espaciais processados (AGISOFT, 2018; 
JAVERNICK; BRASINGTON; CARUSO, 2014). 

3.3.7 DENSIFICAÇÃO DA NUVEM DE PONTOS 

Embora o modelo resultante unicamente do processo de Strucuture from 
Motion possa ser usado para certas aplicações nas geociências, como o estudo da 
estrutura da vegetação e suas características espectrais realizado por Dandois e Ellis 
(2010), sem um processamento mais refinado, esses modelos de elevação do terreno 
normalmente possuem distorções devido à quantidade de ruídos e por não serem 
detalhados o suficiente para reconstruções tridimensionais de alta qualidade 
(ROSNELL; HONKAVAARA, 2012). 

Nesse contexto, o objetivo dos algoritmos de Multi-View Stereo consiste em 
realizar a restituição mais precisa de uma superfície tridimensional por meio de 
imagens cujas localizações dos pontos de exposição são conhecidas. Assim, 
associado ao fluxograma de SfM, os dados referentes aos parâmetros das câmeras 
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reconstituídos na fase de solução da estrutura são inseridos como informação a priori 
para a resolução da configuração espacial completa das feições presentes nas 
imagens adquiridas, de modo que a nuvem de pontos inicialmente esparsa aumenta 
sua densidade em pelo menos dois graus de magnitude, além de reduzir os ruídos e 
aumentar significativamente a qualidade e o nível de detalhamento do MDT gerado 
(HARWIN; LUCIEER, 2012; QU; HUANG; ZHANG, 2018). 

As diferentes formas de aplicar o MVS podem ser classificadas em quatro 
categorias: a primeira consiste em algoritmos que inicialmente computam uma função 
de custo em um volume tridimensional e então extraem deste a superfície analisada; 
a segunda opera desenvolvendo uma superfície de modo iterativo com o intuito de 
minimizar ou reduzir gradativamente uma função de custo; a terceira trabalha a partir 
do processamento de um conjunto de mapas de profundidade, com o cuidado de 
garantir que haja uma única interpretação consistente da cena; por fim, a quarta 
categoria é formada por algoritmos que a princípio extraem e associação um conjunto 
de feições para, em seguida, formar uma superfície que se encaixe nessas feições 
reconstruídas (SEITZ et al, 2006). 

Essa técnica normalmente é usada como uma busca sistemática nos pixels de 
dados matriciais (raster) para reconhecer as melhores relações entre os pontos de 
imagens distintas. Desse modo, se a cena inteira é processada conjuntamente esse 
se torna um processo vagaroso e que exige grande desempenho computacional. Por 
esse motivo foram desenvolvidos algoritmos de MVS que apresentam a opção de 
organizar as fotografias em grupos ou ajustar a extensão da malha da imagem na qual 
serão executados, permitindo então que o tempo necessário para formar a nuvem de 
pontos densa e sua resolução sejam melhor gerenciados para cada contexto utilizado 
(BEMIS et al., 2014). 

Nesse contexto, Furukawa et al. (2010) propõem um algoritmo denominado 
Clustering View for Multi-view Stereo (CMVS) que permite que esse agrupamento 
ocorra entre fotos que possuem pequenas faixas de sobreposição. Após essa etapa, 
o MVS é implementado para reconstruir a geometria tridimensional de cada 
subconjunto, os quais são posteriormente mesclados para formar uma única nuvem 
de pontos. Ademais, para garantir que haja consistência entre as diferentes 
qualidades de imagens trabalhadas provenientes das distâncias variadas pelas quais 
as cenas foram capturadas, o processamento passa por um filtro de erros com 


estimadores robustos que é computado de forma paralela e não concentrada em torno 
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de determinado ponto, facilitando sua implantação em grandes volumes de dados. 
Com essas propriedades, o algoritmo de CMVS foi capaz de trabalhar com milhares 
de imagens de áreas extensas, inclusive sendo o primeiro a ser utilizado para uma 
cidade inteira, Dubrovnik na Croácia. 

Em complemento ao CMVS que decompõe a cena em grupos de imagens, o 
Patch-based Multi-view Stereo (PMVS2) é empregado para densificar a nuvem de 
pontos desses subconjuntos de forma independente. Esse algoritmo é implementado 
em três etapas: as feições identificadas e associadas entre várias imagens formam 
retângulos que são relacionadas a pontos proeminentes na imagem; as 
correspondências realizadas anteriormente são expandidas aos pixels próximos 
aumentando o número de retângulos; limitações na visibilidade são então usadas para 
eliminar associações que possam ter sido geradas na frente ou atrás da superfície de 
fato. Os últimos dois passos podem ser executados mais de uma vez, conforme a 
complexidade da reconstrução em cada situação (FURUKAWA; PONCE, 2007). 

Desse modo, na etapa de densificação realizada no MVS, o conjunto dos 
algoritmos de CMVS e PMVS2 pode ser utilizado para reconstruir satisfatoriamente 
objetos (situações em que se deseja obter um único componente que é claramente 
visível em um grupo de fotografias capturadas em todo seu entorno), cenas (quando 
é necessário recompor tridimensionalmente uma área que pode apresentar setores 
ocultos e com pontos de vistas mais limitados) e cenas com interferências (em casos 
que existem obstáculos se movendo em frente ou sobre a superfície estática de 
interesse) (FURUKAWA; PONCE, 2007; FURUKAWA et al., 2010). 

Portanto, ao contrário de outras técnicas de densificação que só suportam 
aplicações de tipos específicos de dados, essa metodologia é capaz de processar 
imagens para contextos genéricos e pode ser empregada em diversas atividades e, 
por esse motivo, é a mais usada dentro de aplicações com SfM-MVS em geral. Assim, 
através dos milhares de pontos de coordenadas definidas, a interpolação de seus 
dados é realizada para formar a superfície tridimensional do MDT (LUCIEER; JONG; 
TURNER, 2014; VASUKI et al., 2014; WESTOBY et al., 2012). 
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CAPÍTULO 04 


CONTROLE DE QUALIDADE NA CARTOGRAFIA 





A coleta de dados espaciais e a geração de produtos cartográficos são 
processos complexos por envolverem a utilização de vários tipos de metodologia e 
equipamentos, bem como de mão de obra especializada. Assim, para que seja 
possível verificar a qualidade desses produtos, existem procedimentos que analisam 
e classificam os resultados obtidos segundo alguns parâmetros principais: acurácia 
posicional e temática, que avaliam a proximidade dos valores representados com sua 
realidade; linhagem, a qual se refere às informações referentes aos dados espaciais 
utilizados; completude, que averigua a presença das feições essenciais para 
determinada representação; temporalidade, a qual estabelece os períodos em que 
devem ser realizadas atualizações; fidelidade semântica, que verifica se os símbolos 
usados são adequados para determinado atributo; consistência lógica, a qual verifica 
a compatibilidade de uma informação em relação ao conjunto de dados (NOGUEIRA 
JÚNIOR, 2003; ROCHA, 2002; THAPA; BOSSLER, 1992;). 

Dentre esses vários parâmetros de avaliação, a exatidão posicional é um dos 
mais relevantes no processo classificatório da qualidade de produtos cartográficos 
destinados à mensuração, visto que os erros provenientes da aquisição de 
informações espaciais se propagam etapa por etapa, acumulando-se no final e 
podendo gerar discrepâncias consideráveis nas medições realizadas sobre o mapa 
com a realidade da superfície terrestre. Nesse sentido, é importante serem discutidos 
os conceitos de acurácia e precisão, bem como analisados os tipos de erros que 
podem estar presentes nas observações durante o levantamento de campo, visando 
detectá-los para serem minimizados ou corrigidos, quando possível (FERREIRA, 
2014; NERO, 2005) 

4.1 CLASSIFICAÇÃO DOS ERROS 

Segundo Veiga, Zanetti e Faggion (2012), todas as observações das grandezas 
medidas estão passíveis de erros independente dos cuidados durante o levantamento 
de dados, de modo que, mesmo se forem realizadas exatamente com as mesmas 
condições, as medidas não irão ser desprovidas de discrepâncias entre si, isto é, não 
serão todas idênticas. Por isso, a teoria dos erros subdivide as fontes desses erros 


em três classes: quando provenientes da falibilidade humana ou fatores anômalos 
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(erros grosseiros), devido ao uso de instrumentos descalibrados ou providos de 
imperfeições de fábrica (erros sistemáticos) e provenientes das condições ambientais 
(erros aleatórios ou acidentais), isto é, são inevitáveis. 

Os erros grosseiros podem ser oriundos de leituras erradas nos equipamentos, 
da inversão de dígitos no momento de registrar nas cadernetas os valores medidos 
em campo ou da identificação de outro alvo por engano, geralmente sendo associados 
a descuidos dos profissionais ou de falhas nos instrumentos. Entretanto, mesmo 
quando as observações são registradas eletronicamente, como no caso da coleta de 
dados por receptores GNSS, os dígitos dos códigos transmitidos pelos satélites 
podem sofrer alterações devido a ruídos nas transmissões. Para evitar que esse tipo 
de erro esteja presente nas observações, é importante que o operador esteja atento 
no momento da aquisição dos dados, verificando as informações registradas, além da 
abundância de medições facilitar a posterior identificação da existência de valores 
discrepantes (GEMAEL; MACHADO; WANDRESEN, 2015; VEIGA; ZANETTI; 
FAGGION, 2012). 

Já erros denominados de sistemáticos são aqueles que apresentam um 
padrão, de forma que a magnitude e sentido de suas manifestações podem ser 
determinadas ou modeladas modelagens matemáticas e/ou físicas. Desse modo, 
essas alterações nos valores das observações podem ser provenientes de falhas nos 
equipamentos utilizados, de sua não calibração adequada durante o levantamento de 
dados espaciais ou mesmo de efeitos presentes na natureza, como a refração e a 
curvatura da terra. Com o intuito de evitar que esses erros contaminem as medições, 
normalmente são utilizadas técnicas em campo para eliminá-los, a exemplo da 
utilização de leituras angulares conjugadas, na posição inversa e direta da luneta, e 
da implantação do nível a distâncias iguais dos pontos cujos desníveis devem ser 
definidos. Ademais, em casos que esses erros são detectados em escritório, muitas 
vezes podem ser eliminados por fórmulas específicas, quando conhecido seu 
comportamento  (GEMAEL; MACHADO;  WANDRESEN, 2015; THAPA; 
BOSSLER, 1992). 

Por fim, mesmo se forem eliminados os erros sistemáticos e grosseiros, as 
medições ainda vão apresentar discrepâncias em relação as outras. Esse fenômeno 
ocorre devido à existência dos erros acidentais, que independem de qualquer 
tratamento realizado e que são intrínsecos a qualquer observação devido à própria 
incerteza associada ao processo de obtenção de dados espaciais. Tais erros são 
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também chamados de aleatórios por não se manifestarem seguindo uma magnitude 
ou sentido específico e sem que seja possível definir suas causas. Para minimizar os 
efeitos desses erros sobre as observações, são realizados tratamentos estatísticos, 
mais comumente o ajustamento pelo Método Mínimos Quadrados, uma vez que na 
abundância de dados, os erros aleatórios tendem a se comportar segundo a curva de 
distribuição normal de Gauss (KLEIN, 2011). 

4.2 PRECISÃO E ACURÁCIA 

Existem diversas discussões em literatura sobre a definição correta dos 
conceitos de acurácia e precisão. A descrição clássica do fenômeno de precisão está 
relacionada à dispersão dos dados levantados, de modo que quanto mais 
concentrados em torno de um valor mediano, isto é, quanto menor for o desvio padrão 
da distribuição, melhor será a precisão das amostras analisadas. Nesse sentido, são 
verificadas a existência de erros aleatórios, entretanto podendo existir conjuntos de 
dados considerados precisos, mas que não se concentram nas proximidades do valor 
verdadeiro, devido à presença de erros sistemáticos, como mostra a Figura 10, na 
qual a imagem esquerda representa um conjunto mais disperso e, portanto, menos 
preciso que a direita, contudo ambos se encontram distantes do alvo. Em outras 
palavras, a precisão está relacionada apenas ao grau de repetibildade de 
observações sucessivas realizadas em condições similares (ambientais, temporais, 
instrumentais e operacionais) (ANTUNES; LINGNAU, 1997; GEMAEL; MACHADO; 
WANDRESEN, 2015). 


Figura 10 — Precisão da distribuição com erro sistemático. 


Fonte: Andrade, 1998. 
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Quanto à acurácia, certos autores como Andrade (1998) e Mikhail e 
Ackermann, (1976) defendem que este conceito se trata apenas da análise da 
eliminação dos erros sistemáticos, sendo considerados igualmente exatos conjuntos 
de dados que se aproximam do valor real, independentemente de sua dispersão, 
como os apresentados na Figura 11. Entretanto, Monico et al. (2009) trazem uma 
ampla revisão das interpretações desses princípios no âmbito das observações e 
verificam que a análise da acurácia das observações inclui tanto a existência de 
tendência quanto o grau de repetibilidade. Nessa perspectiva, a Figura 11 mostra 
distribuições com nível de acurácia diferentes, sendo a imagem da direita mais exata 
que a da esquerda. Desse modo, torna-se dispensável o uso da expressão “análise 
da acurácia e da precisão posicional”, visto que a primeira já se refere à verificação 


de erros sistemáticos e aleatórios. 


Figura 11 — Exatidão da distribuição. 





Fonte: Andrade, 1998. 


4.3 PADRÃO DE EXATIDÃO CARTOGRÁFICA 

A regulamentação do controle de qualidade posicional é estabelecida em 
diversos países através de normatizações específicas, visto que as a componente 
espacial é um dos dados considerado mais relevantes quando se trata da avaliação 
da qualidade de produtos cartográficos. Como exemplo dessas normas, podem ser 
citadas o United States National Map Accuracy Standards (NMAS) criada em 1947 
nos Estados Unidos, a série 19.000 da ISO (Organização Internacional de 
Padronização), a Australian Map and Spatial Horizontal Data Accuracy Standard 
(AMSDAS) que vigora na Austrália, a Norma da ASPRS (American Society of 
Photogrammetry and Remote Sensing) a qual é fundamentada na raiz do erro médio 
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quadrático (RSME), o Procedimento para os trabalhos de fiscalização da execução de 
ortofotomapas e cartografia digital desenvolvido pelo Instituto Geográfico Português e 
a Especificação Técnica para Aquisição de Dados Geoespaciais Vetoriais (ET-ADGV) 
estabelecida no Brasil (FERREIRA, 2014). A Tabela 02 abaixo expressa uma 


comparação entre as regulamentações aplicadas em certos países. 


Tabela 02 — Comparação entre normas de qualidade de produtos cartográficos. 












































País Controle [Estatísico  |conflança |Planimétrica | EITO Padrão 
África do Sul |- MMQ 95 % Conjunta 0,26 e 0,36 mm 
Austrália 20 RMSE 95 % Separada - 
Brasil - PEC-PCD 90 % Não fica Claro | Depende da escala 
Japão - Desvio Padrão |- Conjunta - 
Erro Circular 
México - Provável ou 50 e 95 % | Conjunta 0,3 ou 0,5 mm 
RMSE 
Portugal Calculados | RMSE 95 % Conjunta - 





Fonte: Adaptada de Pereira e Nero (2012). 


Em âmbito nacional, a primeira norma vigente que se referia à qualidade do 
produto cartográfico foi estabelecida pelo Decreto nº 89.817 de 20 de junho de 1984, 
o qual determinou o Padrão de Exatidão Cartográfica (PEC) como sendo um indicador 
estatístico com intervalo de confiança de 90 %, correspondendo a 1,6449 do Erro 
Padrão (EP). Este último não pode ultrapassar 60,8 % do PEC, quando é determinado 
isoladamente em um produto cartográfico, além de ser considerado nessa norma 
como sinônimo de desvio padrão e erro médio quadrático. Desse modo, foram 
estabelecidas três classes de qualidade, A, Be C. Esses valores podem ser obtidos a 
partir do produto do erro padrão da classe pelo módulo da escala analisada, na 
planimetria, e pela equidistância vertical das curvas de nível, na altimetria, como é 
exposto na Tabela 03 (BRASIL, 1984). 


Tabela 03 — Classificação da acurácia de cartas impressas. 
































Planimetria Altimetria 
Classe 

PEC (mm) EP (mm) PEC (mm) EP (mm) 
A 0,5 x Escala | 0,3 x Escala | 1/2 x Eq. Vertical 1/3 x Eg. Vertical 
B 0,8 x Escala | 0,5 x Escala | 3/5 x Eq. Vertical 2/5 x Eg. Vertical 
C 1 x Escala 0,6 x Escala | 3/4 x Eq. Vertical 1/2 x Eq. Vertical 








Fonte: Adaptada de Brasil (1984). 
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Posteriormente, com o intuito de atualizar os parâmetros de avaliação da 
acurácia posicional considerando o advento da utilização de produtos digitas, a 
Comissão Nacional de Cartografia (CONCAR) publicou em 2011 a Especificação 
Técnica para a Aquisição de Dados Geoespaciais Vetoriais (ET-ADGV), que 
estabeleceu o Padrão de Exatidão Cartográfica dos Produtos Cartográficos Digitais 
(PEC-PCD). Essas novas diretrizes mantêm o padrão de 90% de probabilidade para 
o indicador estatístico da dispersão, mas acrescentam uma nova classificação, mais 
rigorosa, no PEC proposto em 1984 para mapas impressos, que passou a ser a classe 
A, e as demais desceram uma categoria. Desse modo, para que um produto digital 
seja aceito como referência nos bancos de dados do Sistema Cartográfico Nacional e 
da Infraestrutura Nacional de Dados Espaciais seu desvio padrão deve ser igual ou 
inferior ao disposto nessa norma. Os valores planimétricos e altimétricos para os 
modelos digitais (de elevação, de superfície e do terreno) e pontos cotados do PEC e 
do EP são expostos nas Tabelas 04. 


Tabela 04 — Classificação da acurácia de produtos digitais. 









































Classe | Classe Planimetria Altimetria 
PEC PEC-PCD 

PEC (mm) EP (mm) PEC (mm) EP (mm) 
- A 0,28 X Escala |0,17 x Escala |0,27 x Eq. Vertical | 1/6 x Eq. Vertical 
AN B 0,5 x Escala |0,3 x Escala 1/2 x Eg. Vertical | 1/3 x Eq. Vertical 
B C 0,8 x Escala |0,5xEscala |3/5x Eq. Vertical |2/5 x Eq. Vertical 
C D 1 x Escala 0,6 x Escala |3/4x Eq. Vertical |1/2x Eg. Vertical 





Fonte: Adaptada de CONCAR (2011). 
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CAPÍTULO 05 


METODOLOGIA 





5.1 ÁREA DE ESTUDO 

A referente pesquisa foi realizada na cidade de Teresina, capital do estado do 
Piauí e as imagens utilizadas foram capturadas em um talude presente no 
estacionamento do Shopping Rio Poty, localizado no bairro Porenquanto, na Avenida 
Marechal Castelo Branco, às margens do Rio Poty, zona urbana Norte do município. 
A Figura 12 traz o mapa de localização em âmbito estadual e municipal, bem como a 
identificação dos bairros nos arredores do estabelecimento. 


Figura 12 — Mapa de localização. 


Localização do Município de Teresina Localização do Shopping Rio Poty 
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Fonte: Autora (2019). 


5.2 MATERIAIS 

Para a obtenção das imagens, foi utilizada a câmara digital reflex de objetiva 
simples (Digital Single Lens Reflex — DLSR) NIKON modelo D7000 (Figura 13) com 
sensor CMOS (Complementary Metal-Oxide Semiconductor) de 23,6x15,6 mm e 


46 


tamanho da imagem 4928x3264 pixels. A lente usada foi a AF-S DX NIKKOR 18-105 
mm f/3.5-5.6G ED VR, com a distância focal sendo fixada em 18mm para a captura 
das fotografias analisadas no referente trabalho (NIKON CORPORATION, 2010). 


Figura 13 — Câmera Nikon Modelo D7000. 





Fonte: Autora (2019). 


A plataforma escolhida para acoplar a câmera foi o tripé telescópico (Figura 
14), por ser um dos principais instrumentos usados na fotogrametria terrestre, com o 
intuito de garantir a estabilidade do sensor no momento da aquisição das cenas, 
diminuindo o arrastamento presente nas imagens, além de permitir a calibração da 
posição vertical e horizontal da câmera, caso desejado, devido à presença de 


nível tubular. 


Figura 14 — Tripé telescópico. 





Fonte: Autora (2019) 
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Para o apoio de campo e levantamento da posição relativa dos pontos foi 
utilizada a estação total Ruide RTS-822R3 nº 078775, Patrimônio da Universidade 
Federal do Piauí (UFPI) nº 195374, de precisão posicional de (2+2ppm) mm e angular 
de 2”, nível tubular de 30"/2 mm e sistema de medida por laser vermelho visível 
(Classe Il sem prisma) com frequência básica de 60MHz. 


Figura 15 — Estação Total. 





Fonte: Autora (2019). 


Ademais, também foram usados tripés de madeira para fixar a estação total e 
o prisma, trena para medir a altura dos equipamentos e nortear a distância entre 
pontos de exposição consecutivos no momento de captura das fotos, bem como uma 
umbrella para proteger os instrumentos do contato direto com raios solares. 

5.3 PROCEDIMENTOS DE CAMPO 

Inicialmente, foram implantados nove pontos artificiais no terreno a ser 
levantado, com centroides definidos a partir de cruzamentos entre duas linhas de 1 cm 


de espessura e 10 cm de comprimento, na cor preta sobre fundo branco para que 


48 


fosse possível diferenciar facilmente das feições da superfície natural, como 
apresentado no detalhe da Figura 16. 


Figura 16 — Ponto de controle utilizado. 





Fonte: Autora (2019). 


Esses marcos foram dispostos de modo a cobrir toda a extensão a ser 
imageada, conforme demonstrado na Figura 17, com o intuito de permitir que o modelo 
tridimensional fosse submetido à escala e referenciado adequadamente, bem como 


posteriores análises comparativas de precisão. 


Figura 17 — Disposição dos pontos de controle no terreno. 
I 


Es 


— amenas 





Fonte: Autora (2019). 


Posteriormente, foram escolhidos dois pontos (materializados com tinta no 
solo) para formar a linha de base do levantamento topográfico. O primeiro (P,) foi 


utilizado como origem do sistema local de coordenadas planas, arbitrariamente 
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atribuído como X: 100m, Y: 100m, Z: 100m para certificar que não existiriam pontos 
com coordenadas negativas e o segundo (Ps) para referenciar a estação total por 
ângulo e distância, como sendo o Norte (azimute 0º0'0”). 

Assim, inicialmente o aparelho foi devidamente estacionado e calado sobre o 
P,, sendo medida sua altura e introduzidas as informações de posição dos pontos e 
de altura do prisma verticalizado no P,. Com a posição direta (PD) foi visada a parte 
inferior do bastão, posicionando e fixando horizontalmente o fio médio da luneta no 
ponto marcado e, então, elevando-o para o prisma onde a medição de distância é 
realizada (sendo descontados os 35 mm referentes à constante do prisma). 

Após o referenciamento do instrumento, foram realizadas duas séries de 
observações com pares conjugados (posição direta e inversa da luneta) no P, para 
posterior ajustamento da linha de base. Em seguida, foram determinadas as 
coordenadas dos pontos de controle dispostos sobre o terreno, através da observação 
em cada ponto também com duas séries em PD e PI, visando garantir a redução de 
erros sistemáticos na posição dos pontos (Figura 18). 

Posteriormente, a estação total foi posicionada no P, e referenciada por 
coordenadas (já determinada na etapa anterior) em relação ao P,. De forma análoga, 
foram medidos os nove pontos, totalizando 4 séries de pares conjugados por ponto 
de controle, devidamente registradas em um cartão de memória inserido no aparelho 


para otimizar o tempo de levantamento. 


Figura 18 — Estação total na linha de base visando os pontos de controle. 





Fonte: Autora (2019). 
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Com a conclusão do levantamento topográfico, foi dado início à aquisição das 
fotografias (Figura 19). Foram estabelecidas três faixas para a determinação dos 
pontos de exposição, distando da base do talude em cerca de 30, 20 e 15 metros 
respectivamente. Ainda, para garantir uma cobertura uniforme da superfície, a câmera 
foi posicionada com distâncias relativamente equivalentes em imagens consecutivas, 


tendo sido planejado inicialmente a captura de 11 fotos/faixa. 


Figura 19 — Aquisição das fotografias 





Fonte: Autora (2019) 


Entretanto, ao final desses procedimentos foram capturadas mais imagens, 
principalmente nas regiões das extremidades das faixas, como intuito de assegurar 
uma densidade adequada destas na porção do terreno escolhida para realizar o 
referente estudo. Desse modo, foram ao todo obtidas 53 cenas, por fim descartadas 
aquelas que apresentaram menor qualidade (em casos de fotografias adquiridas 
praticamente na mesma posição) e objetos em movimento (como carros, pessoas, 
etc.), totalizando 47 fotos utilizadas para a confecção do MDT. A Figura 20 apresenta 
o exemplo de uma das fotografias (projeção bidimensional em perspectiva) escolhidas 


e inseridas como dados brutos no Agisoft Photoscan. 
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Figura 20 — Fotografia do terreno adquirida em campo. 





Fonte: Autora (2019). 


5.4 PROCESSAMENTO 

Dentre as várias metodologias disponíveis para a realização do processamento 
das fotografias obtidas por algoritmos de SfM-MVS, foi utilizado o software comercial 
Agisoft Photoscan 1.4, versão gratuita de teste por 30 dias, para a execução da 
referente pesquisa, tendo em vista a facilidade de trabalhar com sua interface e por 
permitir a realização de todas as etapas do processamento (conforme tópico 3.3) em 
um único programa. 

Inicialmente as imagens são inseridas no Photoscan e são selecionadas para 
estimar sua qualidade. Considerando que todas apresentam qualidade acima de 0,6 
pixels pode-se iniciar o reconhecimento e correspondência de feições para que sejam 
solucionados a estrutura tridimensional da superfície, gerando uma nuvem esparsa 
de pontos, e determinando a posição dos pontos de exposição, por meio da estimação 


dos parâmetros de rotação e translação da câmera (Figura 21). 
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Figura 21 — Posições estimadas da câmera no momento das exposições. 
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Fonte: Autora (2019). 


Em seguida, para que ao modelo seja submetido à escala e referenciado ao 
sistema local de coordenadas planas, os pontos de controle são marcados nas 
imagens. Com o intuito de otimizar esse procedimento, recomenda-se que a nuvem 
esparsa de pontos seja interpolada formando um MDT simplificado (Figura 22), para 
que o software possa filtrar em quais fotografias essa porção da área está presente 
(Figura 23), possibilitando que os marcos sejam aplicados (quando são visíveis nas 
imagens) ou removidos (quando algum objeto oculta o ponto de apoio). 


ao 


Figura 22 — MDT gerado pela interpolação da nuvem esparsa de pontos. 





Fonte: Autora (2019). 


Figura 23 — Fotografias que apresentam o ponto de controle P1. 
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Fonte: Autora (2019). 


Esse procedimento é então realizado para os nove pontos (cinco de controle e 
quatro de verificação) distribuídos no local, nomeados P1 à P9, conforme Figura 24. 
Posteriormente, são inseridos no programa as coordenadas dos marcos obtidas por 
meio da média das quatro séries de observações conjugadas executadas com a 
estação total, de modo que seja possível referenciar a nuvem esparsa de pontos com 
seis pontos a mais que o mínimo exigido (três) e adequar sua escala através das 


distâncias calculadas entre suas coordenadas. 
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Figura 24 — Identificação dos pontos software. 





Fonte: Autora (2019). 


Posteriormente, foi utilizada a função presente no Photoscan para o 
ajustamento dos coeficientes de calibração interna da câmera (distância focal, 
distorções radial e tangencial). Assim, todos os parâmetros foram selecionados para 
serem refinados de acordo com a transformação otimizada presente no programa 
(Figura 25), visando minimizar os erros não lineares presentes no modelo gerado, 


melhorando a qualidade dos dados e a precisão dos resultados. 


Figura 25 — Refinamento dos parâmetros internos da câmera. 
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Fonte: Autora (2019). 


A partir da nuvem de pontos esparsa devidamente georreferenciada, foram 
executados os algoritmos de Multi- View Stereo para realizar a densificação dos pontos 
com base nas coordenadas estimadas das posições nas quais foram adquiridas as 
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fotografias. Esse processo aumentou consideravelmente as feições representadas 
(Figura 26), permitindo que o terreno fosse, então, caracterizado de forma mais fiel e 


com maior nível de detalhamento. 


Figura 26 — Nuvem de pontos densificada. 





Fonte: Autora (2019). 


É importante ressaltar que para a realização dessa etapa foram utilizadas as 
qualidades originais das imagens, isto é, o parâmetro da qualidade da densificação 
(Ultra-alta) foi escolhido de modo a não realizar o redimensionamento das fotografias 
e possibilitar a geração de mais pontos, contudo exigindo maior tempo de 
processamento. 

Por fim, a nuvem de pontos foi classificada automaticamente para a 
diferenciação entre os pontos presentes na superfície do terreno e outros que 
estivessem acima (postes de iluminação e grades), para que estes últimos não fossem 
utilizados na modelagem da área (Figura 27). Além disso, a delimitação dessa parcela 
foi realizada para eliminar pontos que não sejam de interesse, visando diminuir o 


desempenho computacional exigido. 


Figura 27 — Área de interesse delimitada. 





Fonte: Autora (2019). 
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Desse modo, a partir da nuvem de pontos gerada é possível realizar diversos 
estudos do relevo da região, executar interpolações para modelos tridimensionais, 
comparar com outras metodologias ou mesmo exportá-la para ser trabalhada em 
outros softwares, conforme a finalidade do estudo. 

É importante ressaltar que para esse trabalho foi utilizado uma estação 
fotogramétrica digital com placa de vídeo NVIDIA, processador i7-4770, CPU 
3,40GHz, 8GB de RAM, Sistema Operacional de 64bits, o que reduziu 
consideravelmente o tempo de processamento em relação a outras máquinas. 
Entretanto, ainda sim o desempenho computacional requerido devido à alta qualidade 
das imagens utilizadas e das configurações utilizadas para a reconstrução 
tridimensional com o maior nível de detalhamento possível tornou esse processo mais 
lento, principalmente na densificação da nuvem de pontos que, como pode ser 
verificado no Apêndice A, durou cerca de 2 dias (incluindo a geração de mapas de 
profundidade realizada previamente neste mesmo algoritmo). 

5.5 AVALIAÇÃO DA PRECISÃO POSICIONAL 

Com o intuito de verificar as precisões posicionais resultantes dos modelos 
digitais formados a partir das técnicas de SfM-MVS, as informações tridimensionais 
dos nove pontos de controle estabelecidos, obtidas com a estação total, foram 
consideradas como verdade de campo. Assim, para analisar a discrepância entre 
esses resultados existem diversos parâmetros métricos que podem ser utilizados, 
sendo escolhido para o referente trabalho a Raiz do Erro Quadrático Médio (Root 
Mean Squared Error - RMSE em inglês), visto que é amplamente utilizado e 
reconhecido no meio científico, além de ser uma representação relativamente simples 
de ser compreendida quando está sendo comparado um conjunto de pontos 
distribuídos em vez de superfícies contínuas (HARWIN; LUCIEER, 2012). Nesse 
sentido, temos a fórmula geral do RMSE aplicada a determinada observação, 
conforme a Equação 1. 


Dics(â; — a) 


n 


RMSE = (1) 


Onde n é o número de medições, à, o valor estimado pelo modelo gerado a 


partir do SfM-MVS e a, o valor observado em campo com a estação total. Desse modo, 
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o RSME foi determinado para as coordenadas individualmente (RMSEx,RMSEy, 
RMSE;), para os resultados planimétricos (RMSExy) ,conforme a Equação 2, e para o 


erro tridimensional total (RMSExyz), como mostra a Equação 8. 





Dia = de Dm T)* 
n 


RMSExy = (2) 





Zi Ap PO Vu dao nf 


RMSExyz — il 


(3) 


5.6 AVALIAÇÃO DE TENDÊNCIA 

Para que fosse possível analisar a existência de erros sistemáticos nos dados 
espaciais extraídos dos modelos gerados no Agisfot Photoscan, as coordenadas dos 
quatro pontos de verificação provenientes da média das medições em todas as 
projeções em que os marcos estavam visíveis (XZ) foram comparadas com suas 
coordenadas de referência determinada em campo pela estação total (XP). Nesse 
sentido, são calculadas as discrepâncias encontradas nas coordenadas X (AX), Y (AY) 


e Z (AZ) para cada ponto, conforme a Equação 4: 
AX; = XE — XR (4) 


Assim, a média AX e o desvio padrão Syy da diferença entre as coordenadas 


podem ser obtidos, respectivamente, pelas Equações 5 e 6: 


a DD, 
AX = 551 — 5 
a (5) 


n 2 
| " (AX; — AX) 
os EU. 6 
AX e (6) 


Com o intuito de verificar a tendência dos dados, foi escolhida a distribuição 
unilateral t de Student (mais indicada para conjunto de dados com poucas amostras) 


58 


para realizar o teste de hipótese com 90% (1-x) de confiança, considerando na 
hipótese nula (H,) a não existência de erros sistemáticos e na hipótese alternativa (H,) 
a presença de tendência. Desse modo, a estatística amostral “t,” foi obtida (Equação 
7) e, em seguida, verificada se pertencia ao intervalo de confiança (Equação 8) 


considerado para o grau de liberdade (n — 1) que admite a hipótese nula como válida. 


AX 

ly = =—n (7) 
Sax 

lt] < t(n-1,0) (8) 


Uma vez que análise é realizada, se o módulo do t calculado for inferior ao 
tabelado (Anexo A), considera-se que a amostra não apresenta erros sistemáticos. 
Contudo, caso esse valor seja superior, indicando a existência de tendência na 
distribuição, que é representada pela média das discrepâncias, Galo e Camargo 
(1994) recomendam que esse valor seja subtraído da coordenada de cada ponto para 
reduzir seu efeito na obtenção dos dados. 

5.7 AVALIAÇÃO DA EXATIDÃO CARTOGRÁFICA 

Com a finalidade de verificar a acurácia dos produtos cartográficos obtidos, foi 
realizada a análise da exatidão dos dados coletados em relação ao Padrão de 
Exatidão Cartográfica dos Produtos Cartográficos Digitais (PEC-PCD). Para isso, foi 
comparado o desvio padrão das discrepâncias com o erro padrão (EP) das escalas 
estabelecidas, conforme suas classes, tanto para os resultados planimétricos, como 
altimétricos. 

Dessa forma, o teste de hipóteses definido através do qui-quadrado infere na 
hipótese nula que a variância das discrepâncias amostrais (S,y) é estatisticamente 
igual à variância do erro padrão (ox), considerando o nível de 90% de confiança, 
enquanto a hipótese alternativa trabalha com a possibilidade de Ca e ox serem 
diferentes. Como o EP é determinado para a resultante planimétrica e não para uma 
coordenada, o desvio padrão para uma componente (coordenada) pode ser obtida 
pela Equação 9. Já para a altimetria, o EP se mantém como sendo igual ao seu 


desvio padrão. 
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Ox = 


(9) 


SiS 


Assim, o valor do qui-quadrado (x%) deve ser calculado segundo a Equação 10 
e, posteriormente, comparado com o valor tabelado (Equação 11) conforme o grau de 


liberdade (n — 1) e o intervalo de significância (x) da distribuição. 


2 


S 

xi=5+*(n—1) (10) 
Oy 

X% S Mensiá (11) 


Posteriormente, essa estatística de teste é calculada também para as 
coordenadas Y e Z. Se o valor de x? for inferior ao valor tabelado (Anexo B), a hipótese 
nula é aceita, significando que a o produto cartográfico atende à precisão analisada. 


Caso seja superior, não atende aos padrões da classe referida. 
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CAPÍTULO 06 


RESULTADOS 





A quantidade de pontos com coordenadas conhecidas originado com a 
aplicação dos algoritmos de Structure from Motion, isto é, a restituição inicial do 
terreno pela nuvem esparsa, possibilitou a criação de 55.913 pontos. Com a 
densificação pelo uso da técnica Mult-View Stereo e delimitação conforme a área de 
estudo, a quantidade de pontos passou a ser de mais de 35 milhões de pontos, como 
mostra a Figura 28. 


Figura 28 — Modelo digital do terreno. 
ta Projeto (1 grupo, 47 câmaras) 
- Chunk 1 (47 câmaras, 9 marcadores, 55,913 points) [R] 
» DD Câmaras (47/47 aligned) 
» ED Marcadores (9) 
» ED Shapes (2 points) 
&> Tie Points (55,913 points) 
=) Mapas de Profundidade (47, Ultra high quality, Mild filtering) 


::* Dense Cloud (35,210,579 points, Ultra high quality) 
“> Modelo 3D (5,217,982 faces) 
“ DEM (11316x4554, 6.6 mm/pixy) 





Fonte: Autora (2019). 


Desse modo, com o intuito de apresentar os valores obtidos através da nuvem 
de pontos densificada, foi realizada a interpolação das coordenadas para a geração 
do modelo digital do terreno (MDT), representando tridimensionalmente a superfície 
imageada. Assim, também foram aplicadas as texturas (extraída das fotografias) 
sobre o MDT, as quais permitem a melhor visualização dos detalhes e padrões 
presentes na região retratada, conforme a representação na Figura 29. 
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Figura 29 — Textura aplicada no MDT. 





Fonte: Autora (2019). 


Além disso, o processamento do modelo de elevação digital (DEM) foi 
executado por ser um produto que permitem a realização de medições de 
coordenadas dos pontos, distâncias, áreas e volumes, bem como a geração de dados 
vetoriais como curvas de níveis. Nesse sentido, por se tratar de uma projeção plana, 
é possível determinar em relação a quais eixos esse modelo seria gerado, utilizando- 
se comumente o plano paralelo às fotografias. Entretanto, para o terreno analisado, 
por se tratar de um talude com inclinação considerável, também foi possível formar 
um modelo consistente a partir do plano ortogonal às imagens. 

Assim, para o MDE originados do plano YZ, as curvas de nível se referem às 
coordenadas X, permitindo perceber a noção de profundidade das feições da área de 
interesse, sendo os modelos normalmente provenientes da fotogrametria terrestre. Já 
referente ao plano XY, os modelos digitais gerados apresentam a visão em planta do 
terreno, com as curvas de nível relativa à altura dos pontos (coordenada Z). Essa 
representação costuma ser produto do processamento de imagens aéreas, contudo 
sendo possível extrair das fotografias utilizadas no referente trabalho. 

Por fim, as fotografias foram corrigidas geometricamente para a formação de 
ortofotos e são unidas no ortomosaico, que foi editado para eliminar objetos como 
postes de iluminação, placas de sinalização e hidrante que, em algumas imagens, 
encontravam-se sobrepostos à superfície do terreno, sendo então selecionadas as 
regiões nas quais essas interferências estavam presentes e ajustadas de modo 
subjetivo, conforme a escolha de fotos das mesmas áreas e que não apresentavam 


tais objetos. 
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6.1 AVALIAÇÃO DA PRECISÃO POSICIONAL 

As coordenadas dos pontos de controle foram determinadas através da 
topografia clássica, com o uso da estação total, coletadas a partir de dois pontos 
distintos que, formando uma linha de base, totalizaram quatro séries de leituras 
conjugadas (oito observações) em cada ponto. Dessa forma, a Tabela 05 apresenta 
a média dessas coordenadas, as quais foram estabelecidas como verdade de campo 
para referenciar o modelo gerado por SfM-MVS e verificar sua precisão posicional. 


Tabela 05 — Coordenadas dos pontos de controle. 



































Coordenadas da Estação Total 
Ponto 

X (m) Y (m) Z (m) 
P1 75,156 70,869 103,902 
P2 71,178 70,707 107,024 
P3 65,009 70,547 110529 
P4 77,698 87,461 101,992 
P5 71,450 88,083 106,789 
P6 65,550 89,043 110,154 
P7 77,644 105,787 101,399 
P8 71,504 106,069 106,580 
P9 65,019 106,462 110,039 




















Fonte: Autora (2019). 


A partir dos modelos gerados no software Agisoft Photoscan versão 1.4 foram 
realizadas as comparações com os valores observados em campo, em relação à 
precisão posicional dos cinco pontos de controle distribuídos na área de interesse, 
resultando na Tabela 6, e dos quatro pontos de verificação presentes na Tabela 07, 


indicando RMSE determinado para cada coordenada e tridimensional (total). 


Tabela 06 — Raiz do erro quadrático médio dos pontos de controle. 


























Ponto AX (cm) AY (cm) AZ (cm) Total (cm) 
P1 0,798 0,315 -0,521 1,004 
P3 -0,664 1,014 0,334 1,258 
PS -1,560 -0,200 1,233 1,999 
P7 2,467 1,611 -1,898 3,505 
P9 -1,046 -2,741 0,859 3,057 

RMSE 1,462 1,502 1,118 2,376 




















Fonte: Autora (2019). 
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Tabela 07 — Raiz do erro quadrático médio dos pontos de verificação. 




















Point AX (cm) AY (cm) AZ (cm) Total (cm) 
P2 -0,573 0,506 0,559 0,947 
P4 3,023 0,026 1,317 3,297 
P6 -0,129 -0,818 0,869 1,200 
P8 -0,440 -0,477 1,170 1,337 
RMSE 1,555 0,537 1,021 1,936 























Fonte: Autora (2019). 


Analisando esses valores, é possível perceber que a maioria dos pontos se 
apresentam com discrepâncias inferiores a 1 cm. Entretanto, ao contrário do 
esperado, o erro total na coordenada Z nos pontos de controle é inferior às demais. 
Considerando as discrepâncias tridimensionais, é possível perceber que o Ponto 7 e 
o Ponto 9 são destacados com valores acima de 3 cm. Uma provável explicação para 
esse fenômeno pode ser o fato de que, apesar de aparecerem visíveis em um número 
considerável de imagens, os pontos presentes nesse lado do talude se encontram nas 
extremidades inferiores ou superiores de várias dessas fotos, portanto, estando mais 
sujeitos às distorções inerentes às projeções bidimensionais e à lente da câmera. 

Para os pontos de verificação, o menor erro se encontra na componente Y, com 
magnitude de cerca de 5mm. Já no RMSE tridimensional, o valor do Ponto 4 foi 
significativamente superior aos demais (cerca de 3x maior), devido à propagação do 
erro de sua coordenada X. Por ser um ponto mais centralizado, este esteve presente 
em várias imagens, ou seja, era esperado que sua estimação fosse mais precisa que 
os outros. Esse fator pode ter sido causado, então devido às imagens na faixa mais 
próxima permitem que o centroide do ponto fosse representado por mais de um pixel 
(a distância para o centro de perspectiva da câmera é menor para os pontos 
localizados próximo à base do talude, o que aumenta a escala de sua representação), 
podendo causar maiores discrepâncias entre as observações das coordenadas no 
sistema imagem realizadas manualmente no Photoscan. 

Já no referente à precisão geral do levantamento, considerando a verdade de 
campo como os valores provenientes da estação total, os erros tridimensionais de 
2,4cm e 1,9cm, para os pontos de apoio e verificação respectivamente, correspondem 
ao esperado para essa metodologia, uma vez que a distância média entre o terreno 
fotografado e os pontos de exposição foi de 26,6 metros (conforme o relatório de 


processamento no Apêndice D), corroborando com resultados encontrados em 
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literatura para estudos semelhantes e ratificando a precisão proposta por James e 
Robson (2012) de 1:1000. 

Entre outras coisas, a superposição das imagens uniforme e 
consideravelmente grande em todo terreno estudado contribui para que fossem 
encontrados tais valores. Essa preocupação no momento da aquisição das cenas no 
campo foi reforçada com a captura de mais fotos nas extremidades do terreno ao final 
da execução das faixas planejadas, para garantir que nenhuma parcela da área de 
interesse fosse representada por poucas cenas. 

6.2 AVALIAÇÃO DE TENDÊNCIA 

Com o intuito de analisar a existência de erros sistemáticos nas observações, 
foram determinadas as coordenadas planialtimétricas estimadas no Agisoft (após a 
identificação dos marcos em todas imagens nas quais se encontravam visíveis) e as 


levantadas com a estação total em campo, como mostra a Tabela 08. 


Tabela 08 — Coordenadas estimadas e observadas. 























Ponto Coordenadas Estimadas no Agisoft Coordenadas da Estação Total 

X (m) Y (m) Z (m) X (m) Y (m) Z (m) 
pa Ti IZ2 70,712 107,029 71,178 70,707 107,024 
P4 71,128 87,461 101,979 77,698 87,461 101,992 
P6 65,549 89,035 110,162 65,550 89,043 110,154 
P8 71,500 106,065 106,591 71,504 106,069 106,580 


























Fonte: Autora (2019). 


Em seguida, as diferenças entre essas coordenadas (Tabela 9) são obtidas 
pela Equação 4, substituindo a variável por cada coordenada (X, Y e Z), bem como 
suas médias a partir da Equação 5 e respectivos desvios padrões da Equação 6. 


Tabela 09 — Discrepâncias entre as coordenadas estimadas e observadas. 























Paiiês Discrepância 

AX (m) | AY (m) | AZ (m) 

E2 -0,006 0,005 0,005 

P4 0,030 0,000 -0,013 

P6 -0,001 | -0,008 0,008 

P8 -0,004 | -0,004 | 0,011 
Média 0,005 | -0,002 | 0,003 
Desvio Padrão | 0,017 0,006 0,011 




















Fonte: Autora (2019). 


Para verificar a presença de tendência na distribuição de dados analisada, o 
parâmetro de t de Student foi calculado como mostra a Equação 7 e coletado na tabela 
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(Anexo A) segundo o grau de liberdade 3 (4 pontos de verificação -1) e nível de 
significância 0,01 (10%). A comparação entre esses valores é apresentada na 
Tabela 10. 


Tabela 10 — Avaliação de tendência. 


























Coordenada Esniel tg.0,01 Análise 

X 0,573 2,353 Sem tendência 
Y 0,612 2,353 Sem tendência 
Z 0,549 2,353 Sem tendência 








Fonte: Autora (2019). 


Conforme os resultados expostos acima, é possível perceber que os módulos 
da variável t obtidos para as três componentes planialtimétricas dos pontos se 
encontram abaixo do valor tabelado, isto é, a hipótese nula de que não existem erros 
sistemáticos nessas coordenadas é aceita e os dados analisados não 
possuem tendência. 

6.3 AVALIAÇÃO DA EXATIDÃO CARTOGRÁFICA 

Após o conjunto de coordenadas ter passado na avaliação de tendência, é 
realizado o processo de avaliação da exatidão dos dados através do teste referente 
ao qui-quadrado. Desse modo, considerando a hipótese nula de que a variância da 
amostra é menor que a variância do erro padrão estabelecido na Especificação 
Técnica para a Aquisição de Dados Geoespaciais Vetoriais (ET-ADGV) pela CONCAR 
(2011), são analisadas as classes de acordo com um intervalo de confiança de 90 % 
(ou seja, 10 % de nível de significância) e com grau de liberdade 3, devido à existência 
da observação de quatro pontos de verificação (n — 1). 

É importante ressaltar que as escalas escolhidas para a análise da exatidão 
cartográfica foram escalas grandes, uma vez que as imagens adquiridas no referente 
trabalho foram coletadas distantes apenas dezenas de metros da área de estudo, 
gerando produtos cartográficos digitais com grande nível de detalhamento e de uma 
área pequena em extensão territorial. O erro padrão planimétrico, em metros, é então 
calculado a partir do produto entre o parâmetro EP, em milímetros, apresentado no 
ET-ADGV e o módulo das respectivas escalas, determinado na Tabela 11 conforme 


cada classe. 
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Tabela 11 — Erro padrão planimétrico. 












































Classe Escala 

1/50 1/75 1/100 1/250 1/500 1/750 1/1000 
A 0,009 0,013 0,017 0,043 0,085 0,128 0,170 
B 0,015 0,023 0,030 0,075 0,150 0,225 0,300 
C 0,025 0,038 0,050 0,125 0,250 0,375 0,500 
D 0,030 0,045 0,060 0,150 0,300 0,450 0,600 








Fonte: Autora (2019). 


Posteriormente, os desvios dos erros padrões para uma componente das 
coordenadas planimétricas são obtidos através da Equação 9. Sendo assim, a 
variância desses fatores é determinada como sendo o quadrado dos desvios 
(Tabela 12). 


Tabela 12 — Variância do erro padrão planimétrico. 




















Escala 
Classe 
1/50 1/75 1/100 1/250 1/500 1/750 1/1000 
A 0,00004 |0,00008 10,00014 10,00090 |0,00361 0,00813 10,01445 
B 0,00011 0,00025 10,00045 |10,00281 0,01125 10,02531 0,04500 
C 0,00031 0,00070 10,00125 10,00781 0,03125 10,07031 0,12500 
D 0,00045 |0,00101 0,00180 10,01125 10,04500 10,10125 |0,18000 
































Fonte: Autora (2019). 


Assim, baseado nas variâncias dos erros padrões para cada classe da PEC- 
PCD e na variância das coordenadas planimétricas, foram obtidos os qui-quadrados 
das componentes X e Y (Equação 10), trazidos pelas Tabelas 13 e 14, 


respectivamente. 


Tabela 13 — Cálculo estatístico para a coordenada X. 









































Ciasas Escala 

1/50 1475 1/100 1/250 1/500 1/750 1/1000 
A 24,309 10,804 6,077 0,972 0,243 0,108 0,061 
B 7,806 3,469 1,952 0,312 0,078 0,035 0,020 
C 2,810 1,249 0,703 0,112 0,028 0,012 0,007 
D 1,952 0,867 0,488 0,078 0,020 0,009 0,005 








Fonte: Autora (2019). 





Tabela 14 — Cálculo estatístico para a coordenada Y. 




















Glassé Escala 

1/50 1/75 1/100 1/250 1/500 1/750 1/1000 
A 2,718 1,208 0,680 0,109 0,027 0,012 0,007 
B 0,873 0,388 0,218 0,035 0,009 0,004 0,002 
G 0,314 0,140 0,079 0,013 0,003 0,001 0,001 
D 0,218 0,097 0,055 0,009 0,002 0,001 0,001 
































Fonte: Autora (2019). 


Em seguida, comparando-se seu valor tabelado (Anexo B), como mostra a 
Equação 11, o valor do qui-quadrado para os parâmetros de 10% de significância e 3 
graus de liberdade, apresenta-se como 6,2514. Nesse sentido, o desvio padrão das 
coordenadas pode ser considerado estatisticamente igual ao desvio padrão do EP 
quando os valores forem inferiores ao tabelado, sendo expostos o resultado da 


avaliação de exatidão em X na Tabela15 e em Y na Tabela 16. 


Tabela 15 — Avaliação de exatidão para a coordenada X. 











Classe EScaiA 
1/50 1/75 1/100 1/250 |1/500 |1/750 |1/1000 
A 
B 
Cc 
D 











Fonte: Autora (2019). 


Tabela 16 — Avaliação de exatidão para a coordenada Y. 
































Gisssê Escala 
1/50 1475 1/100 1/250 1/500 1/750 1/1000 
A 
B 
Cc 
D 








Fonte: Autora (2019). 


É possível notar que para X, a análise de exatidão cartográfica atende aos 
requisitos das classes C e D para todas as escalas investidas, da classe B não atende 
apenas à escala 1/50 e da classe A não atende a escalas maiores que 1/100. 
Enquanto para a coordenada Y, a hipótese nula é aceita como classe A para todas. 
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Já para a análise altimétrica, o erro padrão foi calculado a partir da equidistância 


das curvas de nível em cada escala. Para isso, foi adotado o parâmetro de 


proporcionalidade de 1:1000 da equidistância para as escalas avaliadas, isto é, na 


escala 1/1000 foi estabelecido a distância de 1 metro entre as curvas, na 1/750 a 


distância de 0,75m e assim sucessivamente. Desse modo, foi possível determinar o 


erro padrão altimétrico para essas classes (Tabela 17) segundo os padrões propostos 
no PEC-PCD. 


Tabela 17 — Erro padrão altimétrico. 












































Cinsãe Escala 

1/50 1/75 1/100 1/250 1/500 1/750 1/1000 
A 0,008 0,013 0,017 0,042 0,083 0,125 0,167 
B 0,017 0,025 0,033 0,083 0,167 0,250 0,333 
C 0,020 0,030 0,040 0,100 0,200 0,300 0,400 
D 0,025 0,038 0,050 Us 0,250 0,375 0,500 








Fonte: Autora (2019). 


Após essa etapa, é possível definir a variância do erro padrão altimétrico. 


Nesse caso, como o valor proposto no ET-ADGV já se refere unicamente à 


coordenada Z, não é necessário realizar a decomposição como é feita na Equação 9 


para as coordenadas planimétricas, portanto a variância é obtida apenas elevando o 


valor do EP ao quadrado, cujos resultados são apresentados na Tabela 18. 


Tabela 18 — Variância do erro padrão altimétrico. 









































Glassá Escala 

1/50 1/75 1/100 1/250 1/500 1/750 1/1000 
A 0,0001 0,0002 0,0003 0,0017 0,0069 0,0156 0,0278 
B 0,0003 0,0006 0,0011 0,0069 0,0278 0,0625 0,1111 
C 0,0004 0,0009 0,0016 0,0100 0,0400 0,0900 0,1600 
D 0,0006 0,0014 0,0025 0,0156 0,0625 0,1406 0,2500 











Fonte: Autora (2019). 


Dessa maneira, o cálculo do qui-quadrado altimétrico é calculado de forma 


análoga às outras coordenadas, segundo a expressão da Equação 10, encontrando 


os valores relacionados às escalas e classes avaliadas conforme a Tabela 19. 
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Tabela 19 — Cálculo estatístico para a coordenada Z 




















Classe Saia 

1/50 1/75 1/100 1/250 1/500 1/750 1/1000 
A 5,164 2,295 1,291 0,207 0,052 0,023 0,013 
B 1,291 0,574 0,323 0,052 0,013 0,006 0,003 
Cc 0,896 0,398 0,224 0,036 0,009 0,004 0,002 
D 0,574 0,255 0,143 0,023 0,006 0,003 0,001 
































Fonte: Autora (2019) 


Finalmente, a análise da exatidão posicional na coordenada Z (Tabela 20) pode 
ser realizada através da comparação entre os resultados dos qui-quadrados 
encontrados e seu dado estabelecido para o grau de liberdade 3 e intervalo de 


confiança de 90 %, sendo este 6,2514, como dito anteriormente. 


Tabela 20 — Avaliação de exatidão para a coordenada Z. 











Classe Escala 
1/50 1/75 1/100 1/250 1/500 1/750 1/1000 
A 
B 
C 
D 











Fonte: Autora (2019). 


Portanto, na análise de exatidão cartográfica executada para as coordenadas 
altimétricas, os resultados de Z atenderam aos requisitos das classes estabelecidas 
no PEC-PCD de maneira análoga à Y, passando no teste de hipóteses para todas as 
escalas nas classes investidas nas classes A, B, Ce D. 

Assim, analisando os resultados da exatidão posicional, os produtos 
cartográficos gerados foram apresentados em uma escala em que a classe A fosse 
alcançada por todas as coordenadas, escolhida arbitrariamente a escala 1/250. Na 
Figura 30 é apresentado o mapa planialtimétrico do ortomosaico referenciado ao 
sistema de coordenas locais. Para os modelos digitais de elevação, a representação 
no plano YZ encontra-se na Figura 31 e sua projeção no plano XY é disposta na Figura 
32. Vale ressaltar que, apesar da equidistância vertical definida para a escala utilizada 
ser de 0,25m, a utilizada nos mapas confeccionados foi de 0,5m, com a finalidade de 
facilitar a visualização e evitar o excesso de informações, visto que por se tratar de 
um terreno com inclinação considerável, o número de curvas de nível para a 


equidistância determinada seria significativamente grande. 
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Escala do projeto Data do levantamento 


UNIVERSIDADE FEDERAL DO PIAUÍ SISTEMA CATERSIANO 1250 emana 
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COORDENADAS Curvas deNível Equidistância Vertical 
TOPOGRÁFICAS Eixo Z 0.50m 
ORIGEM ARBITRÁRIA: Nº de ortofotos Nº de faixas) Distância Média 
X= 100m; Y=100m; Z= 100m 3 26,6m 
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CAPÍTULO 07 


CONCLUSÃO 





O desenvolvimento das metodologias para aquisição de dados espaciais, 
derivado dos avanços tecnológicos nas últimas décadas, possibilitou que o processo 
de produção cartográfica se tornasse mais simples, rápido e eficiente. Dentre o 
aprimoramento das técnicas já existentes e o surgimento de novas, o método 
emergente de Structure from Motion atrelado ao Multi-View Stereo vem se 
consolidando como uma alternativa para a realização de levantamentos de 
informações tridimensionais de superfícies e objetos por permitir a geração de 
modelos digitais de alta qualidade, com grande nível de detalhamento devido à 
densidade de pontos e custos consideravelmente baixos quando comparado a 
técnicas de varredura como o laser scanner, além de não exigir conhecimentos 
significativamente específicos e rigor extremo na execução do trabalho de campo 
como a fotogrametria tradicional e a topografia clássica. 

Desse modo, mesmo sendo proposto inicialmente para aplicações sem 
finalidades cartográficas, o emprego de SfM-MVS passou a ser explorado no âmbito 
das ciências geodésicas, dando origem a diversas pesquisas com o intuito de avaliar 
seus produtos quanto à precisão e acurácia dos dados. Nesse contexto, o referente 
trabalho foi desenvolvido com a intenção de discutir o uso dessa metodologia na coleta 
de informações espaciais, dependendo dos parâmetros de qualidade posicional 
requeridos. 

Os resultados encontrados referente à geração dos modelos digitais e do 
ortomosaico deixam claro que a grande quantidade de pontos oriundos da nuvem 
densificada permitem a representação visual rica em detalhamento e a descrição do 
relevo do talude analisado. Já no referente à avaliação da precisão das medidas, 
pode-se perceber que essa abordagem abrange a aplicação para diversas atividades 
relacionadas às geociências por apresentar desvio submétrico quando as fotografias 
são capturadas a dezenas ou centenas de metros. 

Como exemplo, podem ser citados o monitoramento de questões ambientais 
como movimento da lava, deslizamentos de terras e incêndios florestais, estudos de 
falhas geológicas, pesquisas de geologia estrutural, quantificação de perdas de solo 
e da erosão em voçorocas, medições glaciológicas e análise de relevos. Além disso, 
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permite que seu uso se estenda para outras áreas do conhecimento como arquitetura, 
em projetos de revitalização de prédios históricos e arqueologia para investigação de 
sítios arqueológicos. 

Quanto à verificação da tendência, devido aos cuidados realizados em campo 
para a determinação da posição dos pontos de controle e durante o 
georreferenciamento dos modelos, a distribuição de dados não apresentou erros 
sistemáticos segundo o teste de hipóteses com 90 % de nível de confiança. A 
avaliação da acurácia posicional em relação ao PEC-PCD também apresentou 
resultados satisfatórios no tocante à qualidade dos dados espaciais, apresentando a 
técnica de SfM-MVS como uma alternativa para obtenção de produtos cartográficos 
planialtimétricos para escalas grandes, visto que todas as coordenadas atenderam 
aos requisitos de classe A para escalas menores ou iguais a 1/100. 

Ademais, a aplicação dessa metodologia possui limitações, assim como todas 
as demais, principalmente ligadas aos requisitos computacionais requeridos, visto 
que, por se tratar de um procedimento majoritariamente automatizado, as condições 
de hardware são significativamente importantes e influenciam o tempo a ser utilizado 
para a realização do processamento das imagens digitais. 

Entretanto, a tendência dos avanços tecnológicos se direciona a desenvolver 
algoritmos que exijam cada vez menos desempenho computacional e permitam a 
geração de dados com maior qualidade e melhor acurácia posicional, estabelecendo 
o potencial da abordagem de Structure from Motion e Multi-View Stereo para se tornar 
uma das principais vertentes a ser seguida pela comunidade científica e pela 
sociedade em geral para o futuro das técnicas de aquisição de dados espaciais por 


fotogrametria digital. 
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Survey Data 


E>9 





fp 


10m 


Fig. 1. Camera locations and image overlap. 


Number of images: 47 Camera stations: 47 

Flying altitude: 26.6 m Tie points: 55,913 
Ground resolution: 6.6 mm/pix Projections: 158,459 
Coverage area: 624 m22 Reprojection error: 0.584 pix 


Camera Model Focal Length PixelSize | Precalibrated 





NIKON D7000 (18 mm) | 4928 x 3264 488x488um|Não | 


Table 1. Cameras. 
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NIKON D7000 (18 mm) 


47 images 
Type Resolution Focal Length Pixel Size 
Frame 4928 x 3264 18 mm 4.88 x 4.88 um 
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Table 2. Calibration coefficients and correlation matrix. 
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Ground Control Points 


02m 

01.6cm 
O1.2cm 
o 0.8cm 
o04cm 
e 0cm 

o-04cm 
o -0.8cm 
O-1.2cm 
O-16cm 
02m 





e Control points + Check points ET 


Fig. 3. GCP locations and error estimates. 


Z error is represented by ellipse color. X,Y errors are represented by ellipse shape. 
Estimated GCP locations are marked with a dot or crossing. 


Número |X error (cm) | Y error (cm) |Z error (cm) |XY error (cm) Total (cm) 
[5 luso [iso  [i1175 |209605 [237551 | 


Table 3. Control points RMSE. 


Número | X error (cm) | Y error (cm) |Z error (cm) | XY error (cm) | Total (cm) 
4 155528 — |0.53685 1.02083  |1.64533 1.93628 


Table 4. Check points RMSE. 
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Rótulo | X error (cm) |Y error (cm) |Z error (cm) | Total (cm) | Imagem (pix) | 
PS Jrsso6o [020044 [123348  ]195857 [0474(37) | 


246749 [161052 |-189791 [35049 [0.430 (21) 
po |-104636  |-274144 [0858594  |3.05737 [0.433 (31) 
146244 [150184 [11175 [237551 [0467 | 


Table 5. Control points. 


Rótulo |X error (cm) |Y error (cm) |Z error (cm) | Total (cm) | Imagem (pix) | 
P6 [0128817 [0817608 [086851 [119974 Jos38(36) | 
PB |-0439726 |-0476752 [116964 [133742 Josi6(s0) | 
(Total [1.55528 [053685 [102083 [193628 [0460 | 


Table 6. Check points. 











Digital Elevation Model 





Sh 
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Fig. 4. Reconstructed digital elevation model. 


Resolution: 6.6 mm/pix 
Point density: 230 points/cm”2 
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Processing Parameters 


Geral 
Câmaras 
Aligned cameras 
Marcadores 
Shapes 
Pontos 
Coordinate system 
Rotation angles 
Nuvem de Pontos 
Pontos 
RMS reprojection error 
Max reprojection error 
Mean key point size 
Sobreposição efetiva 
Parâmetros de alinhamento 
Precisão 
Generic preselection 
Key point limit 
Tie point limit 
Matching time 
Mapas de Profundidade 
Número 
Parâmetros de reconstrução 
Qualidade 
Fitering mode 
Tempo de processamento 
Dense Point Cloud 
Pontos 
Parâmetros de reconstrução 
Qualidade 
Depth fitering 
Depth maps generation time 
Dense cloud generation time 
Modelo 
Faces 
Vértices 
Texture 
Parâmetros de reconstrução 
Surface type 
Source data 
Interpolation 
Qualidade 
Depth filtering 
Número de faces 
Tempo de processamento 
Parâmetros de texturização 
Modo de mapeamento 
Modo de combinação 
Texture size 
Enable hole filing 
UV mapping time 
Blending time 
DEM 
Tamanho 
Coordinate system 
Parâmetros de reconstrução 


47 
47 
9 


2 
Local Coordinates (m) 
Yaw, Pitch, Roll 


55,913 of 63,709 
0.175957 (0.583978 pix) 
0.548371 (12.061 pix) 
3.00172 pix 

3.05502 


Highest 

Sim 

40,000 

10,000 

2 minutes 43 seconds 


47 


Ultra High 
Mild 
20 hours 44 minutes 


35,210,579 


Ultra High 

Mild 

20 hours 44 minutes 
1 days 5 hours 


5,217,982 
2,611,495 
6,000 x 6,000 x 5, uint8 


Mapa de alturas / Terreno 
Dense 

Enabled 

Ultra High 

Mild 

7,032,688 

2 minutes 52 seconds 


Generic 

Mosaico 

6,000 x 6,000 

Sim 

1 minutes 33 seconds 
54 minutes 12 seconds 


10,733 x 4,084 
Local Coordinates (m) 
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Source data 
Interpolation 
Tempo de processamento 
Orthomosaic 
Tamanho 
Coordinate system 
Channels 
Parâmetros de reconstrução 
Modo de combinação 
Surface 
Enable hole filing 
Tempo de processamento 
Software 
Version 
Platform 


Dense cloud 
Enabled 
11 seconds 


7,923 x 2,184 
Local Coordinates (m) 
3, uint8 


Mosaico 

Mesh 

Sim 

1 minutes 20 seconds 


1.4.0 build 5076 
Windows 64 
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ANEXOS 
ANEXO A — TABELA DA DISTRIBUIÇÃO T DE STUDENT 







Área 
À indicada 


Distribuição t de Student 


O ft (Valor tabulado) 






Area na cauda superior 


gi 0,0005 
1 31,82 63,66 1273 3183 636,6 
2 6,965 9,925 14,09 2233 31,60 
3 4541 5841 7,453 10,21 12,92 
4 3747 4,604 5,598 7173 8,610 
5 3365 4032 4773 5894 6,869 
6 3143 3,707 4317 5208 5,959 
7 2998 3499 4,029 4,785 5,408 
8 2896 3,355 3,833 4501 5,041 
9 2821 3250 3,690 4,297 4,781 
10 2764 3,169 3,581 4,144 4,587 
11 2718 3,106 3,497 4,025 4,437 
12 2681 3055 3,428 3,930 4,318 
13 2650 3012 3,372 3852 4,221 
14 2624 2977 3,326 3,787 4,140 
15 2602 2947 3,286 3,733 4,073 
16 2583 2921 3,252 3,686 4,015 
17 2567 2898 3,222 3,646 3,965 
18 2552 2878 3,197 3,610 3,922 
19 2539 2861 3,174 3579 3,883 
20 2528 2845 3,153 3,552 3,850 
21 2518 2831 3,135 3527 3,819 
22 2508 2819 3,119 3,505 3,792 
a 2500 2807 3,104 3485 3,768 
24 2492 2797 3,091 3,467 3,745 
25 2485 2787 3,078 3450 3,725 
26 2479 2779 3,067 3435 3,707 
Dz 2473 2771 3,057 3421 3,689 
28 2467 2763 3,047 3408 3,674 
29 2462 2756 3,038 3,396 3,660 
30 2457 2750 3,030 3,385 3,646 
35 2438 2724 2,996 3,340 3,591 
40 2423 2704 2971 3,307 3,551 
45 2412 2690 2,952 3,281 3,520 
50 E 2403 2678 2037 3,261 349 
z 1,645 | 1,960 | 2,326 3,291 











ANEXO B — TABELA DA DISTRIBUIÇÃO QUI-QUADRADO 


Distribuição Qui-Quadrado 


0,0201 01026 02107 13863 46052 59915 7,3778  9,2104 105965 
02971 07107 10636 33567 77794 94BTT 111433 132767 148602 
08721 16354 22041 53481 10,646 125916 14,4494 16,8119 185475 
1 '6465 27326 34805 73441 1323616 155073 175345 200902 219549 


35706 52260 63038 113403 185403 210261 233367 262170 282997 


70149 9,3904 10,8649 17,3379  25,9894 28,8693 31,0264 348092 37,1564 
8,2604 10,8508  12,4426 193374 284120 31,4104 341696 37,5663 39,9969 


13,5647 16,9279 189392 273362 379159 413372 444608 482782 50,9936 
149535 184927 205992 293360 402560 437730 469792 508922 536719 


29,067 34,642  37,6886 49,3349 63,1671 67,5048  71,4202 76,1538 79,4898 


374848 43,1880  46,4589 593347 743970 790820 832977 883794 91,9518 


90 5( ç 
100 0,0650 779294 823581 99,334 84980 1243421 129,5613 1358069 140,169 
110 1,4 135,4 


120 86,9233 95,046  100,6236 119,3340 140,2326 146,5673 152,2113 158,9500 163,6485 


Tabela que fornece valores c tais que 
P(xn>c)=p, onde n é o número de graus de liberdade 


80 53,5400 60,3915  64,2778 79,3343 96,9782 101,8/95 106,6285 112,3288 116,3209 
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